Converted to new SIMD: -m 3000 -a 0
[hashcat.git] / OpenCL / m03000_a0.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _DES_
9
10 #define NEW_SIMD_CODE
11
12 #include "include/constants.h"
13 #include "include/kernel_vendor.h"
14
15 #define DGST_R0 0
16 #define DGST_R1 1
17 #define DGST_R2 2
18 #define DGST_R3 3
19
20 #include "include/kernel_functions.c"
21 #include "OpenCL/types_ocl.c"
22 #include "OpenCL/common.c"
23 #include "include/rp_kernel.h"
24 #include "OpenCL/rp.c"
25 #include "OpenCL/simd.c"
26
27 #define PERM_OP(a,b,tt,n,m) \
28 {                           \
29   tt = a >> n;              \
30   tt = tt ^ b;              \
31   tt = tt & m;              \
32   b = b ^ tt;               \
33   tt = tt << n;             \
34   a = a ^ tt;               \
35 }
36
37 #define HPERM_OP(a,tt,n,m)  \
38 {                           \
39   tt = a << (16 + n);       \
40   tt = tt ^ a;              \
41   tt = tt & m;              \
42   a  = a ^ tt;              \
43   tt = tt >> (16 + n);      \
44   a  = a ^ tt;              \
45 }
46
47 __constant u32 c_SPtrans[8][64] =
48 {
49   {
50     0x02080800, 0x00080000, 0x02000002, 0x02080802,
51     0x02000000, 0x00080802, 0x00080002, 0x02000002,
52     0x00080802, 0x02080800, 0x02080000, 0x00000802,
53     0x02000802, 0x02000000, 0x00000000, 0x00080002,
54     0x00080000, 0x00000002, 0x02000800, 0x00080800,
55     0x02080802, 0x02080000, 0x00000802, 0x02000800,
56     0x00000002, 0x00000800, 0x00080800, 0x02080002,
57     0x00000800, 0x02000802, 0x02080002, 0x00000000,
58     0x00000000, 0x02080802, 0x02000800, 0x00080002,
59     0x02080800, 0x00080000, 0x00000802, 0x02000800,
60     0x02080002, 0x00000800, 0x00080800, 0x02000002,
61     0x00080802, 0x00000002, 0x02000002, 0x02080000,
62     0x02080802, 0x00080800, 0x02080000, 0x02000802,
63     0x02000000, 0x00000802, 0x00080002, 0x00000000,
64     0x00080000, 0x02000000, 0x02000802, 0x02080800,
65     0x00000002, 0x02080002, 0x00000800, 0x00080802,
66   },
67   {
68     0x40108010, 0x00000000, 0x00108000, 0x40100000,
69     0x40000010, 0x00008010, 0x40008000, 0x00108000,
70     0x00008000, 0x40100010, 0x00000010, 0x40008000,
71     0x00100010, 0x40108000, 0x40100000, 0x00000010,
72     0x00100000, 0x40008010, 0x40100010, 0x00008000,
73     0x00108010, 0x40000000, 0x00000000, 0x00100010,
74     0x40008010, 0x00108010, 0x40108000, 0x40000010,
75     0x40000000, 0x00100000, 0x00008010, 0x40108010,
76     0x00100010, 0x40108000, 0x40008000, 0x00108010,
77     0x40108010, 0x00100010, 0x40000010, 0x00000000,
78     0x40000000, 0x00008010, 0x00100000, 0x40100010,
79     0x00008000, 0x40000000, 0x00108010, 0x40008010,
80     0x40108000, 0x00008000, 0x00000000, 0x40000010,
81     0x00000010, 0x40108010, 0x00108000, 0x40100000,
82     0x40100010, 0x00100000, 0x00008010, 0x40008000,
83     0x40008010, 0x00000010, 0x40100000, 0x00108000,
84   },
85   {
86     0x04000001, 0x04040100, 0x00000100, 0x04000101,
87     0x00040001, 0x04000000, 0x04000101, 0x00040100,
88     0x04000100, 0x00040000, 0x04040000, 0x00000001,
89     0x04040101, 0x00000101, 0x00000001, 0x04040001,
90     0x00000000, 0x00040001, 0x04040100, 0x00000100,
91     0x00000101, 0x04040101, 0x00040000, 0x04000001,
92     0x04040001, 0x04000100, 0x00040101, 0x04040000,
93     0x00040100, 0x00000000, 0x04000000, 0x00040101,
94     0x04040100, 0x00000100, 0x00000001, 0x00040000,
95     0x00000101, 0x00040001, 0x04040000, 0x04000101,
96     0x00000000, 0x04040100, 0x00040100, 0x04040001,
97     0x00040001, 0x04000000, 0x04040101, 0x00000001,
98     0x00040101, 0x04000001, 0x04000000, 0x04040101,
99     0x00040000, 0x04000100, 0x04000101, 0x00040100,
100     0x04000100, 0x00000000, 0x04040001, 0x00000101,
101     0x04000001, 0x00040101, 0x00000100, 0x04040000,
102   },
103   {
104     0x00401008, 0x10001000, 0x00000008, 0x10401008,
105     0x00000000, 0x10400000, 0x10001008, 0x00400008,
106     0x10401000, 0x10000008, 0x10000000, 0x00001008,
107     0x10000008, 0x00401008, 0x00400000, 0x10000000,
108     0x10400008, 0x00401000, 0x00001000, 0x00000008,
109     0x00401000, 0x10001008, 0x10400000, 0x00001000,
110     0x00001008, 0x00000000, 0x00400008, 0x10401000,
111     0x10001000, 0x10400008, 0x10401008, 0x00400000,
112     0x10400008, 0x00001008, 0x00400000, 0x10000008,
113     0x00401000, 0x10001000, 0x00000008, 0x10400000,
114     0x10001008, 0x00000000, 0x00001000, 0x00400008,
115     0x00000000, 0x10400008, 0x10401000, 0x00001000,
116     0x10000000, 0x10401008, 0x00401008, 0x00400000,
117     0x10401008, 0x00000008, 0x10001000, 0x00401008,
118     0x00400008, 0x00401000, 0x10400000, 0x10001008,
119     0x00001008, 0x10000000, 0x10000008, 0x10401000,
120   },
121   {
122     0x08000000, 0x00010000, 0x00000400, 0x08010420,
123     0x08010020, 0x08000400, 0x00010420, 0x08010000,
124     0x00010000, 0x00000020, 0x08000020, 0x00010400,
125     0x08000420, 0x08010020, 0x08010400, 0x00000000,
126     0x00010400, 0x08000000, 0x00010020, 0x00000420,
127     0x08000400, 0x00010420, 0x00000000, 0x08000020,
128     0x00000020, 0x08000420, 0x08010420, 0x00010020,
129     0x08010000, 0x00000400, 0x00000420, 0x08010400,
130     0x08010400, 0x08000420, 0x00010020, 0x08010000,
131     0x00010000, 0x00000020, 0x08000020, 0x08000400,
132     0x08000000, 0x00010400, 0x08010420, 0x00000000,
133     0x00010420, 0x08000000, 0x00000400, 0x00010020,
134     0x08000420, 0x00000400, 0x00000000, 0x08010420,
135     0x08010020, 0x08010400, 0x00000420, 0x00010000,
136     0x00010400, 0x08010020, 0x08000400, 0x00000420,
137     0x00000020, 0x00010420, 0x08010000, 0x08000020,
138   },
139   {
140     0x80000040, 0x00200040, 0x00000000, 0x80202000,
141     0x00200040, 0x00002000, 0x80002040, 0x00200000,
142     0x00002040, 0x80202040, 0x00202000, 0x80000000,
143     0x80002000, 0x80000040, 0x80200000, 0x00202040,
144     0x00200000, 0x80002040, 0x80200040, 0x00000000,
145     0x00002000, 0x00000040, 0x80202000, 0x80200040,
146     0x80202040, 0x80200000, 0x80000000, 0x00002040,
147     0x00000040, 0x00202000, 0x00202040, 0x80002000,
148     0x00002040, 0x80000000, 0x80002000, 0x00202040,
149     0x80202000, 0x00200040, 0x00000000, 0x80002000,
150     0x80000000, 0x00002000, 0x80200040, 0x00200000,
151     0x00200040, 0x80202040, 0x00202000, 0x00000040,
152     0x80202040, 0x00202000, 0x00200000, 0x80002040,
153     0x80000040, 0x80200000, 0x00202040, 0x00000000,
154     0x00002000, 0x80000040, 0x80002040, 0x80202000,
155     0x80200000, 0x00002040, 0x00000040, 0x80200040,
156   },
157   {
158     0x00004000, 0x00000200, 0x01000200, 0x01000004,
159     0x01004204, 0x00004004, 0x00004200, 0x00000000,
160     0x01000000, 0x01000204, 0x00000204, 0x01004000,
161     0x00000004, 0x01004200, 0x01004000, 0x00000204,
162     0x01000204, 0x00004000, 0x00004004, 0x01004204,
163     0x00000000, 0x01000200, 0x01000004, 0x00004200,
164     0x01004004, 0x00004204, 0x01004200, 0x00000004,
165     0x00004204, 0x01004004, 0x00000200, 0x01000000,
166     0x00004204, 0x01004000, 0x01004004, 0x00000204,
167     0x00004000, 0x00000200, 0x01000000, 0x01004004,
168     0x01000204, 0x00004204, 0x00004200, 0x00000000,
169     0x00000200, 0x01000004, 0x00000004, 0x01000200,
170     0x00000000, 0x01000204, 0x01000200, 0x00004200,
171     0x00000204, 0x00004000, 0x01004204, 0x01000000,
172     0x01004200, 0x00000004, 0x00004004, 0x01004204,
173     0x01000004, 0x01004200, 0x01004000, 0x00004004,
174   },
175   {
176     0x20800080, 0x20820000, 0x00020080, 0x00000000,
177     0x20020000, 0x00800080, 0x20800000, 0x20820080,
178     0x00000080, 0x20000000, 0x00820000, 0x00020080,
179     0x00820080, 0x20020080, 0x20000080, 0x20800000,
180     0x00020000, 0x00820080, 0x00800080, 0x20020000,
181     0x20820080, 0x20000080, 0x00000000, 0x00820000,
182     0x20000000, 0x00800000, 0x20020080, 0x20800080,
183     0x00800000, 0x00020000, 0x20820000, 0x00000080,
184     0x00800000, 0x00020000, 0x20000080, 0x20820080,
185     0x00020080, 0x20000000, 0x00000000, 0x00820000,
186     0x20800080, 0x20020080, 0x20020000, 0x00800080,
187     0x20820000, 0x00000080, 0x00800080, 0x20020000,
188     0x20820080, 0x00800000, 0x20800000, 0x20000080,
189     0x00820000, 0x00020080, 0x20020080, 0x20800000,
190     0x00000080, 0x20820000, 0x00820080, 0x00000000,
191     0x20000000, 0x20800080, 0x00020000, 0x00820080,
192   }
193 };
194
195 __constant u32 c_skb[8][64] =
196 {
197   {
198     0x00000000, 0x00000010, 0x20000000, 0x20000010,
199     0x00010000, 0x00010010, 0x20010000, 0x20010010,
200     0x00000800, 0x00000810, 0x20000800, 0x20000810,
201     0x00010800, 0x00010810, 0x20010800, 0x20010810,
202     0x00000020, 0x00000030, 0x20000020, 0x20000030,
203     0x00010020, 0x00010030, 0x20010020, 0x20010030,
204     0x00000820, 0x00000830, 0x20000820, 0x20000830,
205     0x00010820, 0x00010830, 0x20010820, 0x20010830,
206     0x00080000, 0x00080010, 0x20080000, 0x20080010,
207     0x00090000, 0x00090010, 0x20090000, 0x20090010,
208     0x00080800, 0x00080810, 0x20080800, 0x20080810,
209     0x00090800, 0x00090810, 0x20090800, 0x20090810,
210     0x00080020, 0x00080030, 0x20080020, 0x20080030,
211     0x00090020, 0x00090030, 0x20090020, 0x20090030,
212     0x00080820, 0x00080830, 0x20080820, 0x20080830,
213     0x00090820, 0x00090830, 0x20090820, 0x20090830,
214   },
215   {
216     0x00000000, 0x02000000, 0x00002000, 0x02002000,
217     0x00200000, 0x02200000, 0x00202000, 0x02202000,
218     0x00000004, 0x02000004, 0x00002004, 0x02002004,
219     0x00200004, 0x02200004, 0x00202004, 0x02202004,
220     0x00000400, 0x02000400, 0x00002400, 0x02002400,
221     0x00200400, 0x02200400, 0x00202400, 0x02202400,
222     0x00000404, 0x02000404, 0x00002404, 0x02002404,
223     0x00200404, 0x02200404, 0x00202404, 0x02202404,
224     0x10000000, 0x12000000, 0x10002000, 0x12002000,
225     0x10200000, 0x12200000, 0x10202000, 0x12202000,
226     0x10000004, 0x12000004, 0x10002004, 0x12002004,
227     0x10200004, 0x12200004, 0x10202004, 0x12202004,
228     0x10000400, 0x12000400, 0x10002400, 0x12002400,
229     0x10200400, 0x12200400, 0x10202400, 0x12202400,
230     0x10000404, 0x12000404, 0x10002404, 0x12002404,
231     0x10200404, 0x12200404, 0x10202404, 0x12202404,
232   },
233   {
234     0x00000000, 0x00000001, 0x00040000, 0x00040001,
235     0x01000000, 0x01000001, 0x01040000, 0x01040001,
236     0x00000002, 0x00000003, 0x00040002, 0x00040003,
237     0x01000002, 0x01000003, 0x01040002, 0x01040003,
238     0x00000200, 0x00000201, 0x00040200, 0x00040201,
239     0x01000200, 0x01000201, 0x01040200, 0x01040201,
240     0x00000202, 0x00000203, 0x00040202, 0x00040203,
241     0x01000202, 0x01000203, 0x01040202, 0x01040203,
242     0x08000000, 0x08000001, 0x08040000, 0x08040001,
243     0x09000000, 0x09000001, 0x09040000, 0x09040001,
244     0x08000002, 0x08000003, 0x08040002, 0x08040003,
245     0x09000002, 0x09000003, 0x09040002, 0x09040003,
246     0x08000200, 0x08000201, 0x08040200, 0x08040201,
247     0x09000200, 0x09000201, 0x09040200, 0x09040201,
248     0x08000202, 0x08000203, 0x08040202, 0x08040203,
249     0x09000202, 0x09000203, 0x09040202, 0x09040203,
250   },
251   {
252     0x00000000, 0x00100000, 0x00000100, 0x00100100,
253     0x00000008, 0x00100008, 0x00000108, 0x00100108,
254     0x00001000, 0x00101000, 0x00001100, 0x00101100,
255     0x00001008, 0x00101008, 0x00001108, 0x00101108,
256     0x04000000, 0x04100000, 0x04000100, 0x04100100,
257     0x04000008, 0x04100008, 0x04000108, 0x04100108,
258     0x04001000, 0x04101000, 0x04001100, 0x04101100,
259     0x04001008, 0x04101008, 0x04001108, 0x04101108,
260     0x00020000, 0x00120000, 0x00020100, 0x00120100,
261     0x00020008, 0x00120008, 0x00020108, 0x00120108,
262     0x00021000, 0x00121000, 0x00021100, 0x00121100,
263     0x00021008, 0x00121008, 0x00021108, 0x00121108,
264     0x04020000, 0x04120000, 0x04020100, 0x04120100,
265     0x04020008, 0x04120008, 0x04020108, 0x04120108,
266     0x04021000, 0x04121000, 0x04021100, 0x04121100,
267     0x04021008, 0x04121008, 0x04021108, 0x04121108,
268   },
269   {
270     0x00000000, 0x10000000, 0x00010000, 0x10010000,
271     0x00000004, 0x10000004, 0x00010004, 0x10010004,
272     0x20000000, 0x30000000, 0x20010000, 0x30010000,
273     0x20000004, 0x30000004, 0x20010004, 0x30010004,
274     0x00100000, 0x10100000, 0x00110000, 0x10110000,
275     0x00100004, 0x10100004, 0x00110004, 0x10110004,
276     0x20100000, 0x30100000, 0x20110000, 0x30110000,
277     0x20100004, 0x30100004, 0x20110004, 0x30110004,
278     0x00001000, 0x10001000, 0x00011000, 0x10011000,
279     0x00001004, 0x10001004, 0x00011004, 0x10011004,
280     0x20001000, 0x30001000, 0x20011000, 0x30011000,
281     0x20001004, 0x30001004, 0x20011004, 0x30011004,
282     0x00101000, 0x10101000, 0x00111000, 0x10111000,
283     0x00101004, 0x10101004, 0x00111004, 0x10111004,
284     0x20101000, 0x30101000, 0x20111000, 0x30111000,
285     0x20101004, 0x30101004, 0x20111004, 0x30111004,
286   },
287   {
288     0x00000000, 0x08000000, 0x00000008, 0x08000008,
289     0x00000400, 0x08000400, 0x00000408, 0x08000408,
290     0x00020000, 0x08020000, 0x00020008, 0x08020008,
291     0x00020400, 0x08020400, 0x00020408, 0x08020408,
292     0x00000001, 0x08000001, 0x00000009, 0x08000009,
293     0x00000401, 0x08000401, 0x00000409, 0x08000409,
294     0x00020001, 0x08020001, 0x00020009, 0x08020009,
295     0x00020401, 0x08020401, 0x00020409, 0x08020409,
296     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
297     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
298     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
299     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
300     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
301     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
302     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
303     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
304   },
305   {
306     0x00000000, 0x00000100, 0x00080000, 0x00080100,
307     0x01000000, 0x01000100, 0x01080000, 0x01080100,
308     0x00000010, 0x00000110, 0x00080010, 0x00080110,
309     0x01000010, 0x01000110, 0x01080010, 0x01080110,
310     0x00200000, 0x00200100, 0x00280000, 0x00280100,
311     0x01200000, 0x01200100, 0x01280000, 0x01280100,
312     0x00200010, 0x00200110, 0x00280010, 0x00280110,
313     0x01200010, 0x01200110, 0x01280010, 0x01280110,
314     0x00000200, 0x00000300, 0x00080200, 0x00080300,
315     0x01000200, 0x01000300, 0x01080200, 0x01080300,
316     0x00000210, 0x00000310, 0x00080210, 0x00080310,
317     0x01000210, 0x01000310, 0x01080210, 0x01080310,
318     0x00200200, 0x00200300, 0x00280200, 0x00280300,
319     0x01200200, 0x01200300, 0x01280200, 0x01280300,
320     0x00200210, 0x00200310, 0x00280210, 0x00280310,
321     0x01200210, 0x01200310, 0x01280210, 0x01280310,
322   },
323   {
324     0x00000000, 0x04000000, 0x00040000, 0x04040000,
325     0x00000002, 0x04000002, 0x00040002, 0x04040002,
326     0x00002000, 0x04002000, 0x00042000, 0x04042000,
327     0x00002002, 0x04002002, 0x00042002, 0x04042002,
328     0x00000020, 0x04000020, 0x00040020, 0x04040020,
329     0x00000022, 0x04000022, 0x00040022, 0x04040022,
330     0x00002020, 0x04002020, 0x00042020, 0x04042020,
331     0x00002022, 0x04002022, 0x00042022, 0x04042022,
332     0x00000800, 0x04000800, 0x00040800, 0x04040800,
333     0x00000802, 0x04000802, 0x00040802, 0x04040802,
334     0x00002800, 0x04002800, 0x00042800, 0x04042800,
335     0x00002802, 0x04002802, 0x00042802, 0x04042802,
336     0x00000820, 0x04000820, 0x00040820, 0x04040820,
337     0x00000822, 0x04000822, 0x00040822, 0x04040822,
338     0x00002820, 0x04002820, 0x00042820, 0x04042820,
339     0x00002822, 0x04002822, 0x00042822, 0x04042822
340   }
341 };
342
343 #define LM_IV_0_IP_RR3 0x2400b807
344 #define LM_IV_1_IP_RR3 0xaa190747
345
346 #if   VECT_SIZE == 1
347 #define BOX(i,n,S) (S)[(n)][(i)]
348 #elif VECT_SIZE == 2
349 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1])
350 #elif VECT_SIZE == 4
351 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3])
352 #elif VECT_SIZE == 8
353 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7])
354 #endif
355
356 static void _des_crypt_encrypt (u32x iv[2], u32x data[2], u32x Kc[16], u32x Kd[16], __local u32 (*s_SPtrans)[64])
357 {
358   u32x r = data[0];
359   u32x l = data[1];
360
361   #pragma unroll 16
362   for (u32 i = 0; i < 16; i += 2)
363   {
364     u32x u;
365     u32x t;
366
367     u = Kc[i + 0] ^ rotl32 (r, 30u);
368     t = Kd[i + 0] ^ rotl32 (r, 26u);
369
370     l ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
371        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
372        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
373        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
374        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
375        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
376        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
377        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
378
379     u = Kc[i + 1] ^ rotl32 (l, 30u);
380     t = Kd[i + 1] ^ rotl32 (l, 26u);
381
382     r ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
383        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
384        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
385        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
386        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
387        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
388        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
389        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
390   }
391
392   iv[0] = rotl32 (l, 29);
393   iv[1] = rotl32 (r, 29);
394 }
395
396 static void _des_crypt_keysetup (u32x c, u32x d, u32x Kc[16], u32x Kd[16], __local u32 (*s_skb)[64])
397 {
398   u32x tt;
399
400   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
401   HPERM_OP (c,    tt, 2, 0xcccc0000);
402   HPERM_OP (d,    tt, 2, 0xcccc0000);
403   PERM_OP  (d, c, tt, 1, 0x55555555);
404   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
405   PERM_OP  (d, c, tt, 1, 0x55555555);
406
407   d = ((d & 0x000000ff) << 16)
408     | ((d & 0x0000ff00) <<  0)
409     | ((d & 0x00ff0000) >> 16)
410     | ((c & 0xf0000000) >>  4);
411
412   c = c & 0x0fffffff;
413
414   #pragma unroll 16
415   for (u32 i = 0; i < 16; i++)
416   {
417     if ((i < 2) || (i == 8) || (i == 15))
418     {
419       c = ((c >> 1) | (c << 27));
420       d = ((d >> 1) | (d << 27));
421     }
422     else
423     {
424       c = ((c >> 2) | (c << 26));
425       d = ((d >> 2) | (d << 26));
426     }
427
428     c = c & 0x0fffffff;
429     d = d & 0x0fffffff;
430
431     const u32x c00 = (c >>  0) & 0x0000003f;
432     const u32x c06 = (c >>  6) & 0x00383003;
433     const u32x c07 = (c >>  7) & 0x0000003c;
434     const u32x c13 = (c >> 13) & 0x0000060f;
435     const u32x c20 = (c >> 20) & 0x00000001;
436
437     u32x s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
438            | BOX (((c06 >>  0) & 0xff)
439                  |((c07 >>  0) & 0xff), 1, s_skb)
440            | BOX (((c13 >>  0) & 0xff)
441                  |((c06 >>  8) & 0xff), 2, s_skb)
442            | BOX (((c20 >>  0) & 0xff)
443                  |((c13 >>  8) & 0xff)
444                  |((c06 >> 16) & 0xff), 3, s_skb);
445
446     const u32x d00 = (d >>  0) & 0x00003c3f;
447     const u32x d07 = (d >>  7) & 0x00003f03;
448     const u32x d21 = (d >> 21) & 0x0000000f;
449     const u32x d22 = (d >> 22) & 0x00000030;
450
451     u32x t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
452            | BOX (((d07 >>  0) & 0xff)
453                  |((d00 >>  8) & 0xff), 5, s_skb)
454            | BOX (((d07 >>  8) & 0xff), 6, s_skb)
455            | BOX (((d21 >>  0) & 0xff)
456                  |((d22 >>  0) & 0xff), 7, s_skb);
457
458     Kc[i] = ((t << 16) | (s & 0x0000ffff));
459     Kd[i] = ((s >> 16) | (t & 0xffff0000));
460   }
461 }
462
463 static void transform_netntlmv1_key (const u32x w0, const u32x w1, u32x out[2])
464 {
465   u32x t[8];
466
467   t[0] = (w0 >>  0) & 0xff;
468   t[1] = (w0 >>  8) & 0xff;
469   t[2] = (w0 >> 16) & 0xff;
470   t[3] = (w0 >> 24) & 0xff;
471   t[4] = (w1 >>  0) & 0xff;
472   t[5] = (w1 >>  8) & 0xff;
473   t[6] = (w1 >> 16) & 0xff;
474   t[7] = (w1 >> 24) & 0xff;
475
476   u32x k[8];
477
478   k[0] =               (t[0] >> 0);
479   k[1] = (t[0] << 7) | (t[1] >> 1);
480   k[2] = (t[1] << 6) | (t[2] >> 2);
481   k[3] = (t[2] << 5) | (t[3] >> 3);
482   k[4] = (t[3] << 4) | (t[4] >> 4);
483   k[5] = (t[4] << 3) | (t[5] >> 5);
484   k[6] = (t[5] << 2) | (t[6] >> 6);
485   k[7] = (t[6] << 1);
486
487   out[0] = ((k[0] & 0xff) <<  0)
488          | ((k[1] & 0xff) <<  8)
489          | ((k[2] & 0xff) << 16)
490          | ((k[3] & 0xff) << 24);
491
492   out[1] = ((k[4] & 0xff) <<  0)
493          | ((k[5] & 0xff) <<  8)
494          | ((k[6] & 0xff) << 16)
495          | ((k[7] & 0xff) << 24);
496 }
497
498 __kernel void m03000_m04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
499 {
500   /**
501    * modifier
502    */
503
504   const u32 gid = get_global_id (0);
505   const u32 lid = get_local_id (0);
506   const u32 lsz = get_local_size (0);
507
508   /**
509    * base
510    */
511
512   u32 pw_buf0[4];
513
514   pw_buf0[0] = pws[gid].i[ 0];
515   pw_buf0[1] = pws[gid].i[ 1];
516   pw_buf0[2] = 0;
517   pw_buf0[3] = 0;
518
519   u32 pw_buf1[4];
520
521   pw_buf1[0] = 0;
522   pw_buf1[1] = 0;
523   pw_buf1[2] = 0;
524   pw_buf1[3] = 0;
525
526   const u32 pw_len = pws[gid].pw_len;
527
528   /**
529    * sbox, kbox
530    */
531
532   __local u32 s_SPtrans[8][64];
533   __local u32 s_skb[8][64];
534
535   for (u32 i = lid; i < 64; i += lsz)
536   {
537     s_SPtrans[0][i] = c_SPtrans[0][i];
538     s_SPtrans[1][i] = c_SPtrans[1][i];
539     s_SPtrans[2][i] = c_SPtrans[2][i];
540     s_SPtrans[3][i] = c_SPtrans[3][i];
541     s_SPtrans[4][i] = c_SPtrans[4][i];
542     s_SPtrans[5][i] = c_SPtrans[5][i];
543     s_SPtrans[6][i] = c_SPtrans[6][i];
544     s_SPtrans[7][i] = c_SPtrans[7][i];
545
546     s_skb[0][i] = c_skb[0][i];
547     s_skb[1][i] = c_skb[1][i];
548     s_skb[2][i] = c_skb[2][i];
549     s_skb[3][i] = c_skb[3][i];
550     s_skb[4][i] = c_skb[4][i];
551     s_skb[5][i] = c_skb[5][i];
552     s_skb[6][i] = c_skb[6][i];
553     s_skb[7][i] = c_skb[7][i];
554   }
555
556   barrier (CLK_LOCAL_MEM_FENCE);
557
558   if (gid >= gid_max) return;
559
560   /**
561    * main
562    */
563
564   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
565   {
566     u32x w0[4] = { 0 };
567     u32x w1[4] = { 0 };
568     u32x w2[4] = { 0 };
569     u32x w3[4] = { 0 };
570
571     u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
572
573     out_len = (out_len >= 7) ? 7 : out_len;
574
575     u32x key[2];
576
577     transform_netntlmv1_key (w0[0], w0[1], key);
578
579     const u32x c = key[0];
580     const u32x d = key[1];
581
582     u32x Kc[16];
583     u32x Kd[16];
584
585     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
586
587     u32x data[2];
588
589     data[0] = LM_IV_0_IP_RR3;
590     data[1] = LM_IV_1_IP_RR3;
591
592     u32x iv[2];
593
594     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
595
596     const u32x r0 = iv[0];
597     const u32x r1 = iv[1];
598     const u32x r2 = 0;
599     const u32x r3 = 0;
600
601     COMPARE_M_SIMD (r0, r1, r2, r3);
602   }
603 }
604
605 __kernel void m03000_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
606 {
607 }
608
609 __kernel void m03000_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
610 {
611 }
612
613 __kernel void m03000_s04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
614 {
615   /**
616    * modifier
617    */
618
619   const u32 gid = get_global_id (0);
620   const u32 lid = get_local_id (0);
621   const u32 lsz = get_local_size (0);
622
623   /**
624    * base
625    */
626
627   u32 pw_buf0[4];
628
629   pw_buf0[0] = pws[gid].i[ 0];
630   pw_buf0[1] = pws[gid].i[ 1];
631   pw_buf0[2] = 0;
632   pw_buf0[3] = 0;
633
634   u32 pw_buf1[4];
635
636   pw_buf1[0] = 0;
637   pw_buf1[1] = 0;
638   pw_buf1[2] = 0;
639   pw_buf1[3] = 0;
640
641   const u32 pw_len = pws[gid].pw_len;
642
643   /**
644    * sbox, kbox
645    */
646
647   __local u32 s_SPtrans[8][64];
648   __local u32 s_skb[8][64];
649
650   for (u32 i = lid; i < 64; i += lsz)
651   {
652     s_SPtrans[0][i] = c_SPtrans[0][i];
653     s_SPtrans[1][i] = c_SPtrans[1][i];
654     s_SPtrans[2][i] = c_SPtrans[2][i];
655     s_SPtrans[3][i] = c_SPtrans[3][i];
656     s_SPtrans[4][i] = c_SPtrans[4][i];
657     s_SPtrans[5][i] = c_SPtrans[5][i];
658     s_SPtrans[6][i] = c_SPtrans[6][i];
659     s_SPtrans[7][i] = c_SPtrans[7][i];
660
661     s_skb[0][i] = c_skb[0][i];
662     s_skb[1][i] = c_skb[1][i];
663     s_skb[2][i] = c_skb[2][i];
664     s_skb[3][i] = c_skb[3][i];
665     s_skb[4][i] = c_skb[4][i];
666     s_skb[5][i] = c_skb[5][i];
667     s_skb[6][i] = c_skb[6][i];
668     s_skb[7][i] = c_skb[7][i];
669   }
670
671   barrier (CLK_LOCAL_MEM_FENCE);
672
673   if (gid >= gid_max) return;
674
675   /**
676    * digest
677    */
678
679   const u32 search[4] =
680   {
681     digests_buf[digests_offset].digest_buf[DGST_R0],
682     digests_buf[digests_offset].digest_buf[DGST_R1],
683     digests_buf[digests_offset].digest_buf[DGST_R2],
684     digests_buf[digests_offset].digest_buf[DGST_R3]
685   };
686
687   /**
688    * main
689    */
690
691   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
692   {
693     u32x w0[4] = { 0 };
694     u32x w1[4] = { 0 };
695     u32x w2[4] = { 0 };
696     u32x w3[4] = { 0 };
697
698     u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
699
700     out_len = (out_len >= 7) ? 7 : out_len;
701
702     u32x key[2];
703
704     transform_netntlmv1_key (w0[0], w0[1], key);
705
706     const u32x c = key[0];
707     const u32x d = key[1];
708
709     u32x Kc[16];
710     u32x Kd[16];
711
712     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
713
714     u32x data[2];
715
716     data[0] = LM_IV_0_IP_RR3;
717     data[1] = LM_IV_1_IP_RR3;
718
719     u32x iv[2];
720
721     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
722
723     const u32x r0 = iv[0];
724     const u32x r1 = iv[1];
725     const u32x r2 = 0;
726     const u32x r3 = 0;
727
728     COMPARE_S_SIMD (r0, r1, r2, r3);
729   }
730 }
731
732 __kernel void m03000_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
733 {
734 }
735
736 __kernel void m03000_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
737 {
738 }