Converted to new SIMD: -m 5500 -a 0
[hashcat.git] / OpenCL / m05500_a0.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _MD4_
9
10 #define NEW_SIMD_CODE
11
12 #include "include/constants.h"
13 #include "include/kernel_vendor.h"
14
15 #define DGST_R0 0
16 #define DGST_R1 1
17 #define DGST_R2 2
18 #define DGST_R3 3
19
20 #include "include/kernel_functions.c"
21 #include "OpenCL/types_ocl.c"
22 #include "OpenCL/common.c"
23 #include "include/rp_kernel.h"
24 #include "OpenCL/rp.c"
25 #include "OpenCL/simd.c"
26
27 #define PERM_OP(a,b,tt,n,m) \
28 {                           \
29   tt = a >> n;              \
30   tt = tt ^ b;              \
31   tt = tt & m;              \
32   b = b ^ tt;               \
33   tt = tt << n;             \
34   a = a ^ tt;               \
35 }
36
37 #define HPERM_OP(a,tt,n,m)  \
38 {                           \
39   tt = a << (16 + n);       \
40   tt = tt ^ a;              \
41   tt = tt & m;              \
42   a  = a ^ tt;              \
43   tt = tt >> (16 + n);      \
44   a  = a ^ tt;              \
45 }
46
47 __constant u32 c_SPtrans[8][64] =
48 {
49   {
50     0x02080800, 0x00080000, 0x02000002, 0x02080802,
51     0x02000000, 0x00080802, 0x00080002, 0x02000002,
52     0x00080802, 0x02080800, 0x02080000, 0x00000802,
53     0x02000802, 0x02000000, 0x00000000, 0x00080002,
54     0x00080000, 0x00000002, 0x02000800, 0x00080800,
55     0x02080802, 0x02080000, 0x00000802, 0x02000800,
56     0x00000002, 0x00000800, 0x00080800, 0x02080002,
57     0x00000800, 0x02000802, 0x02080002, 0x00000000,
58     0x00000000, 0x02080802, 0x02000800, 0x00080002,
59     0x02080800, 0x00080000, 0x00000802, 0x02000800,
60     0x02080002, 0x00000800, 0x00080800, 0x02000002,
61     0x00080802, 0x00000002, 0x02000002, 0x02080000,
62     0x02080802, 0x00080800, 0x02080000, 0x02000802,
63     0x02000000, 0x00000802, 0x00080002, 0x00000000,
64     0x00080000, 0x02000000, 0x02000802, 0x02080800,
65     0x00000002, 0x02080002, 0x00000800, 0x00080802,
66   },
67   {
68     0x40108010, 0x00000000, 0x00108000, 0x40100000,
69     0x40000010, 0x00008010, 0x40008000, 0x00108000,
70     0x00008000, 0x40100010, 0x00000010, 0x40008000,
71     0x00100010, 0x40108000, 0x40100000, 0x00000010,
72     0x00100000, 0x40008010, 0x40100010, 0x00008000,
73     0x00108010, 0x40000000, 0x00000000, 0x00100010,
74     0x40008010, 0x00108010, 0x40108000, 0x40000010,
75     0x40000000, 0x00100000, 0x00008010, 0x40108010,
76     0x00100010, 0x40108000, 0x40008000, 0x00108010,
77     0x40108010, 0x00100010, 0x40000010, 0x00000000,
78     0x40000000, 0x00008010, 0x00100000, 0x40100010,
79     0x00008000, 0x40000000, 0x00108010, 0x40008010,
80     0x40108000, 0x00008000, 0x00000000, 0x40000010,
81     0x00000010, 0x40108010, 0x00108000, 0x40100000,
82     0x40100010, 0x00100000, 0x00008010, 0x40008000,
83     0x40008010, 0x00000010, 0x40100000, 0x00108000,
84   },
85   {
86     0x04000001, 0x04040100, 0x00000100, 0x04000101,
87     0x00040001, 0x04000000, 0x04000101, 0x00040100,
88     0x04000100, 0x00040000, 0x04040000, 0x00000001,
89     0x04040101, 0x00000101, 0x00000001, 0x04040001,
90     0x00000000, 0x00040001, 0x04040100, 0x00000100,
91     0x00000101, 0x04040101, 0x00040000, 0x04000001,
92     0x04040001, 0x04000100, 0x00040101, 0x04040000,
93     0x00040100, 0x00000000, 0x04000000, 0x00040101,
94     0x04040100, 0x00000100, 0x00000001, 0x00040000,
95     0x00000101, 0x00040001, 0x04040000, 0x04000101,
96     0x00000000, 0x04040100, 0x00040100, 0x04040001,
97     0x00040001, 0x04000000, 0x04040101, 0x00000001,
98     0x00040101, 0x04000001, 0x04000000, 0x04040101,
99     0x00040000, 0x04000100, 0x04000101, 0x00040100,
100     0x04000100, 0x00000000, 0x04040001, 0x00000101,
101     0x04000001, 0x00040101, 0x00000100, 0x04040000,
102   },
103   {
104     0x00401008, 0x10001000, 0x00000008, 0x10401008,
105     0x00000000, 0x10400000, 0x10001008, 0x00400008,
106     0x10401000, 0x10000008, 0x10000000, 0x00001008,
107     0x10000008, 0x00401008, 0x00400000, 0x10000000,
108     0x10400008, 0x00401000, 0x00001000, 0x00000008,
109     0x00401000, 0x10001008, 0x10400000, 0x00001000,
110     0x00001008, 0x00000000, 0x00400008, 0x10401000,
111     0x10001000, 0x10400008, 0x10401008, 0x00400000,
112     0x10400008, 0x00001008, 0x00400000, 0x10000008,
113     0x00401000, 0x10001000, 0x00000008, 0x10400000,
114     0x10001008, 0x00000000, 0x00001000, 0x00400008,
115     0x00000000, 0x10400008, 0x10401000, 0x00001000,
116     0x10000000, 0x10401008, 0x00401008, 0x00400000,
117     0x10401008, 0x00000008, 0x10001000, 0x00401008,
118     0x00400008, 0x00401000, 0x10400000, 0x10001008,
119     0x00001008, 0x10000000, 0x10000008, 0x10401000,
120   },
121   {
122     0x08000000, 0x00010000, 0x00000400, 0x08010420,
123     0x08010020, 0x08000400, 0x00010420, 0x08010000,
124     0x00010000, 0x00000020, 0x08000020, 0x00010400,
125     0x08000420, 0x08010020, 0x08010400, 0x00000000,
126     0x00010400, 0x08000000, 0x00010020, 0x00000420,
127     0x08000400, 0x00010420, 0x00000000, 0x08000020,
128     0x00000020, 0x08000420, 0x08010420, 0x00010020,
129     0x08010000, 0x00000400, 0x00000420, 0x08010400,
130     0x08010400, 0x08000420, 0x00010020, 0x08010000,
131     0x00010000, 0x00000020, 0x08000020, 0x08000400,
132     0x08000000, 0x00010400, 0x08010420, 0x00000000,
133     0x00010420, 0x08000000, 0x00000400, 0x00010020,
134     0x08000420, 0x00000400, 0x00000000, 0x08010420,
135     0x08010020, 0x08010400, 0x00000420, 0x00010000,
136     0x00010400, 0x08010020, 0x08000400, 0x00000420,
137     0x00000020, 0x00010420, 0x08010000, 0x08000020,
138   },
139   {
140     0x80000040, 0x00200040, 0x00000000, 0x80202000,
141     0x00200040, 0x00002000, 0x80002040, 0x00200000,
142     0x00002040, 0x80202040, 0x00202000, 0x80000000,
143     0x80002000, 0x80000040, 0x80200000, 0x00202040,
144     0x00200000, 0x80002040, 0x80200040, 0x00000000,
145     0x00002000, 0x00000040, 0x80202000, 0x80200040,
146     0x80202040, 0x80200000, 0x80000000, 0x00002040,
147     0x00000040, 0x00202000, 0x00202040, 0x80002000,
148     0x00002040, 0x80000000, 0x80002000, 0x00202040,
149     0x80202000, 0x00200040, 0x00000000, 0x80002000,
150     0x80000000, 0x00002000, 0x80200040, 0x00200000,
151     0x00200040, 0x80202040, 0x00202000, 0x00000040,
152     0x80202040, 0x00202000, 0x00200000, 0x80002040,
153     0x80000040, 0x80200000, 0x00202040, 0x00000000,
154     0x00002000, 0x80000040, 0x80002040, 0x80202000,
155     0x80200000, 0x00002040, 0x00000040, 0x80200040,
156   },
157   {
158     0x00004000, 0x00000200, 0x01000200, 0x01000004,
159     0x01004204, 0x00004004, 0x00004200, 0x00000000,
160     0x01000000, 0x01000204, 0x00000204, 0x01004000,
161     0x00000004, 0x01004200, 0x01004000, 0x00000204,
162     0x01000204, 0x00004000, 0x00004004, 0x01004204,
163     0x00000000, 0x01000200, 0x01000004, 0x00004200,
164     0x01004004, 0x00004204, 0x01004200, 0x00000004,
165     0x00004204, 0x01004004, 0x00000200, 0x01000000,
166     0x00004204, 0x01004000, 0x01004004, 0x00000204,
167     0x00004000, 0x00000200, 0x01000000, 0x01004004,
168     0x01000204, 0x00004204, 0x00004200, 0x00000000,
169     0x00000200, 0x01000004, 0x00000004, 0x01000200,
170     0x00000000, 0x01000204, 0x01000200, 0x00004200,
171     0x00000204, 0x00004000, 0x01004204, 0x01000000,
172     0x01004200, 0x00000004, 0x00004004, 0x01004204,
173     0x01000004, 0x01004200, 0x01004000, 0x00004004,
174   },
175   {
176     0x20800080, 0x20820000, 0x00020080, 0x00000000,
177     0x20020000, 0x00800080, 0x20800000, 0x20820080,
178     0x00000080, 0x20000000, 0x00820000, 0x00020080,
179     0x00820080, 0x20020080, 0x20000080, 0x20800000,
180     0x00020000, 0x00820080, 0x00800080, 0x20020000,
181     0x20820080, 0x20000080, 0x00000000, 0x00820000,
182     0x20000000, 0x00800000, 0x20020080, 0x20800080,
183     0x00800000, 0x00020000, 0x20820000, 0x00000080,
184     0x00800000, 0x00020000, 0x20000080, 0x20820080,
185     0x00020080, 0x20000000, 0x00000000, 0x00820000,
186     0x20800080, 0x20020080, 0x20020000, 0x00800080,
187     0x20820000, 0x00000080, 0x00800080, 0x20020000,
188     0x20820080, 0x00800000, 0x20800000, 0x20000080,
189     0x00820000, 0x00020080, 0x20020080, 0x20800000,
190     0x00000080, 0x20820000, 0x00820080, 0x00000000,
191     0x20000000, 0x20800080, 0x00020000, 0x00820080,
192   }
193 };
194
195 __constant u32 c_skb[8][64] =
196 {
197   {
198     0x00000000, 0x00000010, 0x20000000, 0x20000010,
199     0x00010000, 0x00010010, 0x20010000, 0x20010010,
200     0x00000800, 0x00000810, 0x20000800, 0x20000810,
201     0x00010800, 0x00010810, 0x20010800, 0x20010810,
202     0x00000020, 0x00000030, 0x20000020, 0x20000030,
203     0x00010020, 0x00010030, 0x20010020, 0x20010030,
204     0x00000820, 0x00000830, 0x20000820, 0x20000830,
205     0x00010820, 0x00010830, 0x20010820, 0x20010830,
206     0x00080000, 0x00080010, 0x20080000, 0x20080010,
207     0x00090000, 0x00090010, 0x20090000, 0x20090010,
208     0x00080800, 0x00080810, 0x20080800, 0x20080810,
209     0x00090800, 0x00090810, 0x20090800, 0x20090810,
210     0x00080020, 0x00080030, 0x20080020, 0x20080030,
211     0x00090020, 0x00090030, 0x20090020, 0x20090030,
212     0x00080820, 0x00080830, 0x20080820, 0x20080830,
213     0x00090820, 0x00090830, 0x20090820, 0x20090830,
214   },
215   {
216     0x00000000, 0x02000000, 0x00002000, 0x02002000,
217     0x00200000, 0x02200000, 0x00202000, 0x02202000,
218     0x00000004, 0x02000004, 0x00002004, 0x02002004,
219     0x00200004, 0x02200004, 0x00202004, 0x02202004,
220     0x00000400, 0x02000400, 0x00002400, 0x02002400,
221     0x00200400, 0x02200400, 0x00202400, 0x02202400,
222     0x00000404, 0x02000404, 0x00002404, 0x02002404,
223     0x00200404, 0x02200404, 0x00202404, 0x02202404,
224     0x10000000, 0x12000000, 0x10002000, 0x12002000,
225     0x10200000, 0x12200000, 0x10202000, 0x12202000,
226     0x10000004, 0x12000004, 0x10002004, 0x12002004,
227     0x10200004, 0x12200004, 0x10202004, 0x12202004,
228     0x10000400, 0x12000400, 0x10002400, 0x12002400,
229     0x10200400, 0x12200400, 0x10202400, 0x12202400,
230     0x10000404, 0x12000404, 0x10002404, 0x12002404,
231     0x10200404, 0x12200404, 0x10202404, 0x12202404,
232   },
233   {
234     0x00000000, 0x00000001, 0x00040000, 0x00040001,
235     0x01000000, 0x01000001, 0x01040000, 0x01040001,
236     0x00000002, 0x00000003, 0x00040002, 0x00040003,
237     0x01000002, 0x01000003, 0x01040002, 0x01040003,
238     0x00000200, 0x00000201, 0x00040200, 0x00040201,
239     0x01000200, 0x01000201, 0x01040200, 0x01040201,
240     0x00000202, 0x00000203, 0x00040202, 0x00040203,
241     0x01000202, 0x01000203, 0x01040202, 0x01040203,
242     0x08000000, 0x08000001, 0x08040000, 0x08040001,
243     0x09000000, 0x09000001, 0x09040000, 0x09040001,
244     0x08000002, 0x08000003, 0x08040002, 0x08040003,
245     0x09000002, 0x09000003, 0x09040002, 0x09040003,
246     0x08000200, 0x08000201, 0x08040200, 0x08040201,
247     0x09000200, 0x09000201, 0x09040200, 0x09040201,
248     0x08000202, 0x08000203, 0x08040202, 0x08040203,
249     0x09000202, 0x09000203, 0x09040202, 0x09040203,
250   },
251   {
252     0x00000000, 0x00100000, 0x00000100, 0x00100100,
253     0x00000008, 0x00100008, 0x00000108, 0x00100108,
254     0x00001000, 0x00101000, 0x00001100, 0x00101100,
255     0x00001008, 0x00101008, 0x00001108, 0x00101108,
256     0x04000000, 0x04100000, 0x04000100, 0x04100100,
257     0x04000008, 0x04100008, 0x04000108, 0x04100108,
258     0x04001000, 0x04101000, 0x04001100, 0x04101100,
259     0x04001008, 0x04101008, 0x04001108, 0x04101108,
260     0x00020000, 0x00120000, 0x00020100, 0x00120100,
261     0x00020008, 0x00120008, 0x00020108, 0x00120108,
262     0x00021000, 0x00121000, 0x00021100, 0x00121100,
263     0x00021008, 0x00121008, 0x00021108, 0x00121108,
264     0x04020000, 0x04120000, 0x04020100, 0x04120100,
265     0x04020008, 0x04120008, 0x04020108, 0x04120108,
266     0x04021000, 0x04121000, 0x04021100, 0x04121100,
267     0x04021008, 0x04121008, 0x04021108, 0x04121108,
268   },
269   {
270     0x00000000, 0x10000000, 0x00010000, 0x10010000,
271     0x00000004, 0x10000004, 0x00010004, 0x10010004,
272     0x20000000, 0x30000000, 0x20010000, 0x30010000,
273     0x20000004, 0x30000004, 0x20010004, 0x30010004,
274     0x00100000, 0x10100000, 0x00110000, 0x10110000,
275     0x00100004, 0x10100004, 0x00110004, 0x10110004,
276     0x20100000, 0x30100000, 0x20110000, 0x30110000,
277     0x20100004, 0x30100004, 0x20110004, 0x30110004,
278     0x00001000, 0x10001000, 0x00011000, 0x10011000,
279     0x00001004, 0x10001004, 0x00011004, 0x10011004,
280     0x20001000, 0x30001000, 0x20011000, 0x30011000,
281     0x20001004, 0x30001004, 0x20011004, 0x30011004,
282     0x00101000, 0x10101000, 0x00111000, 0x10111000,
283     0x00101004, 0x10101004, 0x00111004, 0x10111004,
284     0x20101000, 0x30101000, 0x20111000, 0x30111000,
285     0x20101004, 0x30101004, 0x20111004, 0x30111004,
286   },
287   {
288     0x00000000, 0x08000000, 0x00000008, 0x08000008,
289     0x00000400, 0x08000400, 0x00000408, 0x08000408,
290     0x00020000, 0x08020000, 0x00020008, 0x08020008,
291     0x00020400, 0x08020400, 0x00020408, 0x08020408,
292     0x00000001, 0x08000001, 0x00000009, 0x08000009,
293     0x00000401, 0x08000401, 0x00000409, 0x08000409,
294     0x00020001, 0x08020001, 0x00020009, 0x08020009,
295     0x00020401, 0x08020401, 0x00020409, 0x08020409,
296     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
297     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
298     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
299     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
300     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
301     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
302     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
303     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
304   },
305   {
306     0x00000000, 0x00000100, 0x00080000, 0x00080100,
307     0x01000000, 0x01000100, 0x01080000, 0x01080100,
308     0x00000010, 0x00000110, 0x00080010, 0x00080110,
309     0x01000010, 0x01000110, 0x01080010, 0x01080110,
310     0x00200000, 0x00200100, 0x00280000, 0x00280100,
311     0x01200000, 0x01200100, 0x01280000, 0x01280100,
312     0x00200010, 0x00200110, 0x00280010, 0x00280110,
313     0x01200010, 0x01200110, 0x01280010, 0x01280110,
314     0x00000200, 0x00000300, 0x00080200, 0x00080300,
315     0x01000200, 0x01000300, 0x01080200, 0x01080300,
316     0x00000210, 0x00000310, 0x00080210, 0x00080310,
317     0x01000210, 0x01000310, 0x01080210, 0x01080310,
318     0x00200200, 0x00200300, 0x00280200, 0x00280300,
319     0x01200200, 0x01200300, 0x01280200, 0x01280300,
320     0x00200210, 0x00200310, 0x00280210, 0x00280310,
321     0x01200210, 0x01200310, 0x01280210, 0x01280310,
322   },
323   {
324     0x00000000, 0x04000000, 0x00040000, 0x04040000,
325     0x00000002, 0x04000002, 0x00040002, 0x04040002,
326     0x00002000, 0x04002000, 0x00042000, 0x04042000,
327     0x00002002, 0x04002002, 0x00042002, 0x04042002,
328     0x00000020, 0x04000020, 0x00040020, 0x04040020,
329     0x00000022, 0x04000022, 0x00040022, 0x04040022,
330     0x00002020, 0x04002020, 0x00042020, 0x04042020,
331     0x00002022, 0x04002022, 0x00042022, 0x04042022,
332     0x00000800, 0x04000800, 0x00040800, 0x04040800,
333     0x00000802, 0x04000802, 0x00040802, 0x04040802,
334     0x00002800, 0x04002800, 0x00042800, 0x04042800,
335     0x00002802, 0x04002802, 0x00042802, 0x04042802,
336     0x00000820, 0x04000820, 0x00040820, 0x04040820,
337     0x00000822, 0x04000822, 0x00040822, 0x04040822,
338     0x00002820, 0x04002820, 0x00042820, 0x04042820,
339     0x00002822, 0x04002822, 0x00042822, 0x04042822
340   }
341 };
342
343 #if   VECT_SIZE == 1
344 #define BOX(i,n,S) (S)[(n)][(i)]
345 #elif VECT_SIZE == 2
346 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1])
347 #elif VECT_SIZE == 4
348 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3])
349 #elif VECT_SIZE == 8
350 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7])
351 #endif
352
353 static void _des_crypt_encrypt (u32x iv[2], u32x data[2], u32x Kc[16], u32x Kd[16], __local u32 (*s_SPtrans)[64])
354 {
355   u32x r = data[0];
356   u32x l = data[1];
357
358   #pragma unroll 16
359   for (u32 i = 0; i < 16; i += 2)
360   {
361     u32x u;
362     u32x t;
363
364     u = Kc[i + 0] ^ rotl32 (r, 30u);
365     t = Kd[i + 0] ^ rotl32 (r, 26u);
366
367     l ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
368        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
369        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
370        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
371        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
372        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
373        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
374        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
375
376     u = Kc[i + 1] ^ rotl32 (l, 30u);
377     t = Kd[i + 1] ^ rotl32 (l, 26u);
378
379     r ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
380        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
381        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
382        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
383        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
384        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
385        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
386        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
387   }
388
389   iv[0] = l;
390   iv[1] = r;
391 }
392
393 static void _des_crypt_keysetup (u32x c, u32x d, u32x Kc[16], u32x Kd[16], __local u32 (*s_skb)[64])
394 {
395   u32x tt;
396
397   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
398   HPERM_OP (c,    tt, 2, 0xcccc0000);
399   HPERM_OP (d,    tt, 2, 0xcccc0000);
400   PERM_OP  (d, c, tt, 1, 0x55555555);
401   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
402   PERM_OP  (d, c, tt, 1, 0x55555555);
403
404   d = ((d & 0x000000ff) << 16)
405     | ((d & 0x0000ff00) <<  0)
406     | ((d & 0x00ff0000) >> 16)
407     | ((c & 0xf0000000) >>  4);
408
409   c = c & 0x0fffffff;
410
411   #pragma unroll 16
412   for (u32 i = 0; i < 16; i++)
413   {
414     if ((i < 2) || (i == 8) || (i == 15))
415     {
416       c = ((c >> 1) | (c << 27));
417       d = ((d >> 1) | (d << 27));
418     }
419     else
420     {
421       c = ((c >> 2) | (c << 26));
422       d = ((d >> 2) | (d << 26));
423     }
424
425     c = c & 0x0fffffff;
426     d = d & 0x0fffffff;
427
428     const u32x c00 = (c >>  0) & 0x0000003f;
429     const u32x c06 = (c >>  6) & 0x00383003;
430     const u32x c07 = (c >>  7) & 0x0000003c;
431     const u32x c13 = (c >> 13) & 0x0000060f;
432     const u32x c20 = (c >> 20) & 0x00000001;
433
434     u32x s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
435            | BOX (((c06 >>  0) & 0xff)
436                  |((c07 >>  0) & 0xff), 1, s_skb)
437            | BOX (((c13 >>  0) & 0xff)
438                  |((c06 >>  8) & 0xff), 2, s_skb)
439            | BOX (((c20 >>  0) & 0xff)
440                  |((c13 >>  8) & 0xff)
441                  |((c06 >> 16) & 0xff), 3, s_skb);
442
443     const u32x d00 = (d >>  0) & 0x00003c3f;
444     const u32x d07 = (d >>  7) & 0x00003f03;
445     const u32x d21 = (d >> 21) & 0x0000000f;
446     const u32x d22 = (d >> 22) & 0x00000030;
447
448     u32x t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
449            | BOX (((d07 >>  0) & 0xff)
450                  |((d00 >>  8) & 0xff), 5, s_skb)
451            | BOX (((d07 >>  8) & 0xff), 6, s_skb)
452            | BOX (((d21 >>  0) & 0xff)
453                  |((d22 >>  0) & 0xff), 7, s_skb);
454
455     Kc[i] = ((t << 16) | (s & 0x0000ffff));
456     Kd[i] = ((s >> 16) | (t & 0xffff0000));
457   }
458 }
459
460 static void transform_netntlmv1_key (const u32x w0, const u32x w1, u32x out[2])
461 {
462   u32x t[8];
463
464   t[0] = (w0 >>  0) & 0xff;
465   t[1] = (w0 >>  8) & 0xff;
466   t[2] = (w0 >> 16) & 0xff;
467   t[3] = (w0 >> 24) & 0xff;
468   t[4] = (w1 >>  0) & 0xff;
469   t[5] = (w1 >>  8) & 0xff;
470   t[6] = (w1 >> 16) & 0xff;
471   t[7] = (w1 >> 24) & 0xff;
472
473   u32x k[8];
474
475   k[0] =               (t[0] >> 0);
476   k[1] = (t[0] << 7) | (t[1] >> 1);
477   k[2] = (t[1] << 6) | (t[2] >> 2);
478   k[3] = (t[2] << 5) | (t[3] >> 3);
479   k[4] = (t[3] << 4) | (t[4] >> 4);
480   k[5] = (t[4] << 3) | (t[5] >> 5);
481   k[6] = (t[5] << 2) | (t[6] >> 6);
482   k[7] = (t[6] << 1);
483
484   out[0] = ((k[0] & 0xff) <<  0)
485          | ((k[1] & 0xff) <<  8)
486          | ((k[2] & 0xff) << 16)
487          | ((k[3] & 0xff) << 24);
488
489   out[1] = ((k[4] & 0xff) <<  0)
490          | ((k[5] & 0xff) <<  8)
491          | ((k[6] & 0xff) << 16)
492          | ((k[7] & 0xff) << 24);
493 }
494
495 __kernel void m05500_m04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
496 {
497   /**
498    * modifier
499    */
500
501   const u32 gid = get_global_id (0);
502   const u32 lid = get_local_id (0);
503   const u32 lsz = get_local_size (0);
504
505   /**
506    * sbox, kbox
507    */
508
509   __local u32 s_SPtrans[8][64];
510   __local u32 s_skb[8][64];
511
512   for (u32 i = lid; i < 64; i += lsz)
513   {
514     s_SPtrans[0][i] = c_SPtrans[0][i];
515     s_SPtrans[1][i] = c_SPtrans[1][i];
516     s_SPtrans[2][i] = c_SPtrans[2][i];
517     s_SPtrans[3][i] = c_SPtrans[3][i];
518     s_SPtrans[4][i] = c_SPtrans[4][i];
519     s_SPtrans[5][i] = c_SPtrans[5][i];
520     s_SPtrans[6][i] = c_SPtrans[6][i];
521     s_SPtrans[7][i] = c_SPtrans[7][i];
522
523     s_skb[0][i] = c_skb[0][i];
524     s_skb[1][i] = c_skb[1][i];
525     s_skb[2][i] = c_skb[2][i];
526     s_skb[3][i] = c_skb[3][i];
527     s_skb[4][i] = c_skb[4][i];
528     s_skb[5][i] = c_skb[5][i];
529     s_skb[6][i] = c_skb[6][i];
530     s_skb[7][i] = c_skb[7][i];
531   }
532
533   barrier (CLK_LOCAL_MEM_FENCE);
534
535   if (gid >= gid_max) return;
536
537   /**
538    * base
539    */
540
541   u32 pw_buf0[4];
542
543   pw_buf0[0] = pws[gid].i[ 0];
544   pw_buf0[1] = pws[gid].i[ 1];
545   pw_buf0[2] = pws[gid].i[ 2];
546   pw_buf0[3] = pws[gid].i[ 3];
547
548   u32 pw_buf1[4];
549
550   pw_buf1[0] = pws[gid].i[ 4];
551   pw_buf1[1] = pws[gid].i[ 5];
552   pw_buf1[2] = pws[gid].i[ 6];
553   pw_buf1[3] = pws[gid].i[ 7];
554
555   const u32 pw_len = pws[gid].pw_len;
556
557   /**
558    * salt
559    */
560
561   const u32 s0 = salt_bufs[salt_pos].salt_buf[0];
562   const u32 s1 = salt_bufs[salt_pos].salt_buf[1];
563   const u32 s2 = salt_bufs[salt_pos].salt_buf[2];
564
565   u32 data[2];
566
567   data[0] = s0;
568   data[1] = s1;
569
570   /**
571    * loop
572    */
573
574   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
575   {
576     u32x w0[4] = { 0 };
577     u32x w1[4] = { 0 };
578     u32x w2[4] = { 0 };
579     u32x w3[4] = { 0 };
580
581     const u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
582
583     append_0x80_2x4 (w0, w1, out_len);
584
585     u32x w0_t[4];
586     u32x w1_t[4];
587     u32x w2_t[4];
588     u32x w3_t[4];
589
590     make_unicode (w0, w0_t, w1_t);
591     make_unicode (w1, w2_t, w3_t);
592
593     w3_t[2] = out_len * 8 * 2;
594
595     u32x a = MD4M_A;
596     u32x b = MD4M_B;
597     u32x c = MD4M_C;
598     u32x d = MD4M_D;
599
600     MD4_STEP (MD4_Fo, a, b, c, d, w0_t[0], MD4C00, MD4S00);
601     MD4_STEP (MD4_Fo, d, a, b, c, w0_t[1], MD4C00, MD4S01);
602     MD4_STEP (MD4_Fo, c, d, a, b, w0_t[2], MD4C00, MD4S02);
603     MD4_STEP (MD4_Fo, b, c, d, a, w0_t[3], MD4C00, MD4S03);
604     MD4_STEP (MD4_Fo, a, b, c, d, w1_t[0], MD4C00, MD4S00);
605     MD4_STEP (MD4_Fo, d, a, b, c, w1_t[1], MD4C00, MD4S01);
606     MD4_STEP (MD4_Fo, c, d, a, b, w1_t[2], MD4C00, MD4S02);
607     MD4_STEP (MD4_Fo, b, c, d, a, w1_t[3], MD4C00, MD4S03);
608     MD4_STEP (MD4_Fo, a, b, c, d, w2_t[0], MD4C00, MD4S00);
609     MD4_STEP (MD4_Fo, d, a, b, c, w2_t[1], MD4C00, MD4S01);
610     MD4_STEP (MD4_Fo, c, d, a, b, w2_t[2], MD4C00, MD4S02);
611     MD4_STEP (MD4_Fo, b, c, d, a, w2_t[3], MD4C00, MD4S03);
612     MD4_STEP (MD4_Fo, a, b, c, d, w3_t[0], MD4C00, MD4S00);
613     MD4_STEP (MD4_Fo, d, a, b, c, w3_t[1], MD4C00, MD4S01);
614     MD4_STEP (MD4_Fo, c, d, a, b, w3_t[2], MD4C00, MD4S02);
615     MD4_STEP (MD4_Fo, b, c, d, a, w3_t[3], MD4C00, MD4S03);
616
617     MD4_STEP (MD4_Go, a, b, c, d, w0_t[0], MD4C01, MD4S10);
618     MD4_STEP (MD4_Go, d, a, b, c, w1_t[0], MD4C01, MD4S11);
619     MD4_STEP (MD4_Go, c, d, a, b, w2_t[0], MD4C01, MD4S12);
620     MD4_STEP (MD4_Go, b, c, d, a, w3_t[0], MD4C01, MD4S13);
621     MD4_STEP (MD4_Go, a, b, c, d, w0_t[1], MD4C01, MD4S10);
622     MD4_STEP (MD4_Go, d, a, b, c, w1_t[1], MD4C01, MD4S11);
623     MD4_STEP (MD4_Go, c, d, a, b, w2_t[1], MD4C01, MD4S12);
624     MD4_STEP (MD4_Go, b, c, d, a, w3_t[1], MD4C01, MD4S13);
625     MD4_STEP (MD4_Go, a, b, c, d, w0_t[2], MD4C01, MD4S10);
626     MD4_STEP (MD4_Go, d, a, b, c, w1_t[2], MD4C01, MD4S11);
627     MD4_STEP (MD4_Go, c, d, a, b, w2_t[2], MD4C01, MD4S12);
628     MD4_STEP (MD4_Go, b, c, d, a, w3_t[2], MD4C01, MD4S13);
629     MD4_STEP (MD4_Go, a, b, c, d, w0_t[3], MD4C01, MD4S10);
630     MD4_STEP (MD4_Go, d, a, b, c, w1_t[3], MD4C01, MD4S11);
631     MD4_STEP (MD4_Go, c, d, a, b, w2_t[3], MD4C01, MD4S12);
632     MD4_STEP (MD4_Go, b, c, d, a, w3_t[3], MD4C01, MD4S13);
633
634     MD4_STEP (MD4_H , a, b, c, d, w0_t[0], MD4C02, MD4S20);
635     MD4_STEP (MD4_H , d, a, b, c, w2_t[0], MD4C02, MD4S21);
636     MD4_STEP (MD4_H , c, d, a, b, w1_t[0], MD4C02, MD4S22);
637     MD4_STEP (MD4_H , b, c, d, a, w3_t[0], MD4C02, MD4S23);
638     MD4_STEP (MD4_H , a, b, c, d, w0_t[2], MD4C02, MD4S20);
639     MD4_STEP (MD4_H , d, a, b, c, w2_t[2], MD4C02, MD4S21);
640     MD4_STEP (MD4_H , c, d, a, b, w1_t[2], MD4C02, MD4S22);
641     MD4_STEP (MD4_H , b, c, d, a, w3_t[2], MD4C02, MD4S23);
642     MD4_STEP (MD4_H , a, b, c, d, w0_t[1], MD4C02, MD4S20);
643     MD4_STEP (MD4_H , d, a, b, c, w2_t[1], MD4C02, MD4S21);
644     MD4_STEP (MD4_H , c, d, a, b, w1_t[1], MD4C02, MD4S22);
645     MD4_STEP (MD4_H , b, c, d, a, w3_t[1], MD4C02, MD4S23);
646     MD4_STEP (MD4_H , a, b, c, d, w0_t[3], MD4C02, MD4S20);
647     MD4_STEP (MD4_H , d, a, b, c, w2_t[3], MD4C02, MD4S21);
648
649     if (MATCHES_NONE_VS (((d + MD4M_D) >> 16), s2)) continue;
650
651     MD4_STEP (MD4_H , c, d, a, b, w1_t[3], MD4C02, MD4S22);
652     MD4_STEP (MD4_H , b, c, d, a, w3_t[3], MD4C02, MD4S23);
653
654     a += MD4M_A;
655     b += MD4M_B;
656     c += MD4M_C;
657     d += MD4M_D;
658
659     /**
660      * DES1
661      */
662
663     u32x key[2];
664
665     transform_netntlmv1_key (a, b, key);
666
667     u32x Kc[16];
668     u32x Kd[16];
669
670     _des_crypt_keysetup (key[0], key[1], Kc, Kd, s_skb);
671
672     u32x data[2];
673
674     data[0] = s0;
675     data[1] = s1;
676
677     u32x iv1[2];
678
679     _des_crypt_encrypt (iv1, data, Kc, Kd, s_SPtrans);
680
681     /**
682      * DES2
683      */
684
685     const u32x bc = (b >> 24) | (c << 8);
686     const u32x cd = (c >> 24) | (d << 8);
687
688     transform_netntlmv1_key (bc, cd, key);
689
690     _des_crypt_keysetup (key[0], key[1], Kc, Kd, s_skb);
691
692     u32x iv2[2];
693
694     _des_crypt_encrypt (iv2, data, Kc, Kd, s_SPtrans);
695
696     /**
697      * compare
698      */
699
700     COMPARE_M_SIMD (iv1[0], iv1[1], iv2[0], iv2[1]);
701   }
702 }
703
704 __kernel void m05500_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
705 {
706 }
707
708 __kernel void m05500_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
709 {
710 }
711
712 __kernel void m05500_s04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
713 {
714   /**
715    * modifier
716    */
717
718   const u32 gid = get_global_id (0);
719   const u32 lid = get_local_id (0);
720   const u32 lsz = get_local_size (0);
721
722   /**
723    * sbox, kbox
724    */
725
726   __local u32 s_SPtrans[8][64];
727   __local u32 s_skb[8][64];
728
729   for (u32 i = lid; i < 64; i += lsz)
730   {
731     s_SPtrans[0][i] = c_SPtrans[0][i];
732     s_SPtrans[1][i] = c_SPtrans[1][i];
733     s_SPtrans[2][i] = c_SPtrans[2][i];
734     s_SPtrans[3][i] = c_SPtrans[3][i];
735     s_SPtrans[4][i] = c_SPtrans[4][i];
736     s_SPtrans[5][i] = c_SPtrans[5][i];
737     s_SPtrans[6][i] = c_SPtrans[6][i];
738     s_SPtrans[7][i] = c_SPtrans[7][i];
739
740     s_skb[0][i] = c_skb[0][i];
741     s_skb[1][i] = c_skb[1][i];
742     s_skb[2][i] = c_skb[2][i];
743     s_skb[3][i] = c_skb[3][i];
744     s_skb[4][i] = c_skb[4][i];
745     s_skb[5][i] = c_skb[5][i];
746     s_skb[6][i] = c_skb[6][i];
747     s_skb[7][i] = c_skb[7][i];
748   }
749
750   barrier (CLK_LOCAL_MEM_FENCE);
751
752   if (gid >= gid_max) return;
753
754   /**
755    * base
756    */
757
758   u32 pw_buf0[4];
759
760   pw_buf0[0] = pws[gid].i[ 0];
761   pw_buf0[1] = pws[gid].i[ 1];
762   pw_buf0[2] = pws[gid].i[ 2];
763   pw_buf0[3] = pws[gid].i[ 3];
764
765   u32 pw_buf1[4];
766
767   pw_buf1[0] = pws[gid].i[ 4];
768   pw_buf1[1] = pws[gid].i[ 5];
769   pw_buf1[2] = pws[gid].i[ 6];
770   pw_buf1[3] = pws[gid].i[ 7];
771
772   const u32 pw_len = pws[gid].pw_len;
773
774   /**
775    * salt
776    */
777
778   const u32 s0 = salt_bufs[salt_pos].salt_buf[0];
779   const u32 s1 = salt_bufs[salt_pos].salt_buf[1];
780   const u32 s2 = salt_bufs[salt_pos].salt_buf[2];
781
782   u32 data[2];
783
784   data[0] = s0;
785   data[1] = s1;
786
787   /**
788    * digest
789    */
790
791   const u32 search[4] =
792   {
793     digests_buf[digests_offset].digest_buf[DGST_R0],
794     digests_buf[digests_offset].digest_buf[DGST_R1],
795     digests_buf[digests_offset].digest_buf[DGST_R2],
796     digests_buf[digests_offset].digest_buf[DGST_R3]
797   };
798
799   /**
800    * loop
801    */
802
803   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
804   {
805     u32x w0[4] = { 0 };
806     u32x w1[4] = { 0 };
807     u32x w2[4] = { 0 };
808     u32x w3[4] = { 0 };
809
810     const u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
811
812     append_0x80_2x4 (w0, w1, out_len);
813
814     u32x w0_t[4];
815     u32x w1_t[4];
816     u32x w2_t[4];
817     u32x w3_t[4];
818
819     make_unicode (w0, w0_t, w1_t);
820     make_unicode (w1, w2_t, w3_t);
821
822     w3_t[2] = out_len * 8 * 2;
823
824     u32x a = MD4M_A;
825     u32x b = MD4M_B;
826     u32x c = MD4M_C;
827     u32x d = MD4M_D;
828
829     MD4_STEP (MD4_Fo, a, b, c, d, w0_t[0], MD4C00, MD4S00);
830     MD4_STEP (MD4_Fo, d, a, b, c, w0_t[1], MD4C00, MD4S01);
831     MD4_STEP (MD4_Fo, c, d, a, b, w0_t[2], MD4C00, MD4S02);
832     MD4_STEP (MD4_Fo, b, c, d, a, w0_t[3], MD4C00, MD4S03);
833     MD4_STEP (MD4_Fo, a, b, c, d, w1_t[0], MD4C00, MD4S00);
834     MD4_STEP (MD4_Fo, d, a, b, c, w1_t[1], MD4C00, MD4S01);
835     MD4_STEP (MD4_Fo, c, d, a, b, w1_t[2], MD4C00, MD4S02);
836     MD4_STEP (MD4_Fo, b, c, d, a, w1_t[3], MD4C00, MD4S03);
837     MD4_STEP (MD4_Fo, a, b, c, d, w2_t[0], MD4C00, MD4S00);
838     MD4_STEP (MD4_Fo, d, a, b, c, w2_t[1], MD4C00, MD4S01);
839     MD4_STEP (MD4_Fo, c, d, a, b, w2_t[2], MD4C00, MD4S02);
840     MD4_STEP (MD4_Fo, b, c, d, a, w2_t[3], MD4C00, MD4S03);
841     MD4_STEP (MD4_Fo, a, b, c, d, w3_t[0], MD4C00, MD4S00);
842     MD4_STEP (MD4_Fo, d, a, b, c, w3_t[1], MD4C00, MD4S01);
843     MD4_STEP (MD4_Fo, c, d, a, b, w3_t[2], MD4C00, MD4S02);
844     MD4_STEP (MD4_Fo, b, c, d, a, w3_t[3], MD4C00, MD4S03);
845
846     MD4_STEP (MD4_Go, a, b, c, d, w0_t[0], MD4C01, MD4S10);
847     MD4_STEP (MD4_Go, d, a, b, c, w1_t[0], MD4C01, MD4S11);
848     MD4_STEP (MD4_Go, c, d, a, b, w2_t[0], MD4C01, MD4S12);
849     MD4_STEP (MD4_Go, b, c, d, a, w3_t[0], MD4C01, MD4S13);
850     MD4_STEP (MD4_Go, a, b, c, d, w0_t[1], MD4C01, MD4S10);
851     MD4_STEP (MD4_Go, d, a, b, c, w1_t[1], MD4C01, MD4S11);
852     MD4_STEP (MD4_Go, c, d, a, b, w2_t[1], MD4C01, MD4S12);
853     MD4_STEP (MD4_Go, b, c, d, a, w3_t[1], MD4C01, MD4S13);
854     MD4_STEP (MD4_Go, a, b, c, d, w0_t[2], MD4C01, MD4S10);
855     MD4_STEP (MD4_Go, d, a, b, c, w1_t[2], MD4C01, MD4S11);
856     MD4_STEP (MD4_Go, c, d, a, b, w2_t[2], MD4C01, MD4S12);
857     MD4_STEP (MD4_Go, b, c, d, a, w3_t[2], MD4C01, MD4S13);
858     MD4_STEP (MD4_Go, a, b, c, d, w0_t[3], MD4C01, MD4S10);
859     MD4_STEP (MD4_Go, d, a, b, c, w1_t[3], MD4C01, MD4S11);
860     MD4_STEP (MD4_Go, c, d, a, b, w2_t[3], MD4C01, MD4S12);
861     MD4_STEP (MD4_Go, b, c, d, a, w3_t[3], MD4C01, MD4S13);
862
863     MD4_STEP (MD4_H , a, b, c, d, w0_t[0], MD4C02, MD4S20);
864     MD4_STEP (MD4_H , d, a, b, c, w2_t[0], MD4C02, MD4S21);
865     MD4_STEP (MD4_H , c, d, a, b, w1_t[0], MD4C02, MD4S22);
866     MD4_STEP (MD4_H , b, c, d, a, w3_t[0], MD4C02, MD4S23);
867     MD4_STEP (MD4_H , a, b, c, d, w0_t[2], MD4C02, MD4S20);
868     MD4_STEP (MD4_H , d, a, b, c, w2_t[2], MD4C02, MD4S21);
869     MD4_STEP (MD4_H , c, d, a, b, w1_t[2], MD4C02, MD4S22);
870     MD4_STEP (MD4_H , b, c, d, a, w3_t[2], MD4C02, MD4S23);
871     MD4_STEP (MD4_H , a, b, c, d, w0_t[1], MD4C02, MD4S20);
872     MD4_STEP (MD4_H , d, a, b, c, w2_t[1], MD4C02, MD4S21);
873     MD4_STEP (MD4_H , c, d, a, b, w1_t[1], MD4C02, MD4S22);
874     MD4_STEP (MD4_H , b, c, d, a, w3_t[1], MD4C02, MD4S23);
875     MD4_STEP (MD4_H , a, b, c, d, w0_t[3], MD4C02, MD4S20);
876     MD4_STEP (MD4_H , d, a, b, c, w2_t[3], MD4C02, MD4S21);
877
878     if (MATCHES_NONE_VS (((d + MD4M_D) >> 16), s2)) continue;
879
880     MD4_STEP (MD4_H , c, d, a, b, w1_t[3], MD4C02, MD4S22);
881     MD4_STEP (MD4_H , b, c, d, a, w3_t[3], MD4C02, MD4S23);
882
883     a += MD4M_A;
884     b += MD4M_B;
885     c += MD4M_C;
886     d += MD4M_D;
887
888     /**
889      * DES1
890      */
891
892     u32x key[2];
893
894     transform_netntlmv1_key (a, b, key);
895
896     u32x Kc[16];
897     u32x Kd[16];
898
899     _des_crypt_keysetup (key[0], key[1], Kc, Kd, s_skb);
900
901     u32x data[2];
902
903     data[0] = s0;
904     data[1] = s1;
905
906     u32x iv1[2];
907
908     _des_crypt_encrypt (iv1, data, Kc, Kd, s_SPtrans);
909
910     /**
911      * DES2
912      */
913
914     /*
915     transform_netntlmv1_key (((b >> 24) | (c << 8)), ((c >> 24) | (d << 8)), key);
916
917     _des_crypt_keysetup (key[0], key[1], Kc, Kd, s_skb);
918
919     u32x iv2[2];
920
921     _des_crypt_encrypt (iv2, data, Kc, Kd, s_SPtrans);
922     */
923
924     u32x iv2[2];
925
926     iv2[0] = search[2];
927     iv2[1] = search[3];
928
929     /**
930      * compare
931      */
932
933     COMPARE_S_SIMD (iv1[0], iv1[1], iv2[0], iv2[1]);
934   }
935 }
936
937 __kernel void m05500_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
938 {
939 }
940
941 __kernel void m05500_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
942 {
943 }