- Added inline declaration to functions from simd.c, common.c, rp.c and types_ocl...
[hashcat.git] / OpenCL / m05500_a0.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *               magnum <john.magnum@hushmail.com>
5  *
6  * License.....: MIT
7  */
8
9 #define _MD4_
10
11 #define NEW_SIMD_CODE
12
13 #include "include/constants.h"
14 #include "include/kernel_vendor.h"
15
16 #define DGST_R0 0
17 #define DGST_R1 1
18 #define DGST_R2 2
19 #define DGST_R3 3
20
21 #include "include/kernel_functions.c"
22 #include "OpenCL/types_ocl.c"
23 #include "OpenCL/common.c"
24 #include "include/rp_kernel.h"
25 #include "OpenCL/rp.c"
26 #include "OpenCL/simd.c"
27
28 #define PERM_OP(a,b,tt,n,m) \
29 {                           \
30   tt = a >> n;              \
31   tt = tt ^ b;              \
32   tt = tt & m;              \
33   b = b ^ tt;               \
34   tt = tt << n;             \
35   a = a ^ tt;               \
36 }
37
38 #define HPERM_OP(a,tt,n,m)  \
39 {                           \
40   tt = a << (16 + n);       \
41   tt = tt ^ a;              \
42   tt = tt & m;              \
43   a  = a ^ tt;              \
44   tt = tt >> (16 + n);      \
45   a  = a ^ tt;              \
46 }
47
48 __constant u32 c_SPtrans[8][64] =
49 {
50   {
51     0x02080800, 0x00080000, 0x02000002, 0x02080802,
52     0x02000000, 0x00080802, 0x00080002, 0x02000002,
53     0x00080802, 0x02080800, 0x02080000, 0x00000802,
54     0x02000802, 0x02000000, 0x00000000, 0x00080002,
55     0x00080000, 0x00000002, 0x02000800, 0x00080800,
56     0x02080802, 0x02080000, 0x00000802, 0x02000800,
57     0x00000002, 0x00000800, 0x00080800, 0x02080002,
58     0x00000800, 0x02000802, 0x02080002, 0x00000000,
59     0x00000000, 0x02080802, 0x02000800, 0x00080002,
60     0x02080800, 0x00080000, 0x00000802, 0x02000800,
61     0x02080002, 0x00000800, 0x00080800, 0x02000002,
62     0x00080802, 0x00000002, 0x02000002, 0x02080000,
63     0x02080802, 0x00080800, 0x02080000, 0x02000802,
64     0x02000000, 0x00000802, 0x00080002, 0x00000000,
65     0x00080000, 0x02000000, 0x02000802, 0x02080800,
66     0x00000002, 0x02080002, 0x00000800, 0x00080802,
67   },
68   {
69     0x40108010, 0x00000000, 0x00108000, 0x40100000,
70     0x40000010, 0x00008010, 0x40008000, 0x00108000,
71     0x00008000, 0x40100010, 0x00000010, 0x40008000,
72     0x00100010, 0x40108000, 0x40100000, 0x00000010,
73     0x00100000, 0x40008010, 0x40100010, 0x00008000,
74     0x00108010, 0x40000000, 0x00000000, 0x00100010,
75     0x40008010, 0x00108010, 0x40108000, 0x40000010,
76     0x40000000, 0x00100000, 0x00008010, 0x40108010,
77     0x00100010, 0x40108000, 0x40008000, 0x00108010,
78     0x40108010, 0x00100010, 0x40000010, 0x00000000,
79     0x40000000, 0x00008010, 0x00100000, 0x40100010,
80     0x00008000, 0x40000000, 0x00108010, 0x40008010,
81     0x40108000, 0x00008000, 0x00000000, 0x40000010,
82     0x00000010, 0x40108010, 0x00108000, 0x40100000,
83     0x40100010, 0x00100000, 0x00008010, 0x40008000,
84     0x40008010, 0x00000010, 0x40100000, 0x00108000,
85   },
86   {
87     0x04000001, 0x04040100, 0x00000100, 0x04000101,
88     0x00040001, 0x04000000, 0x04000101, 0x00040100,
89     0x04000100, 0x00040000, 0x04040000, 0x00000001,
90     0x04040101, 0x00000101, 0x00000001, 0x04040001,
91     0x00000000, 0x00040001, 0x04040100, 0x00000100,
92     0x00000101, 0x04040101, 0x00040000, 0x04000001,
93     0x04040001, 0x04000100, 0x00040101, 0x04040000,
94     0x00040100, 0x00000000, 0x04000000, 0x00040101,
95     0x04040100, 0x00000100, 0x00000001, 0x00040000,
96     0x00000101, 0x00040001, 0x04040000, 0x04000101,
97     0x00000000, 0x04040100, 0x00040100, 0x04040001,
98     0x00040001, 0x04000000, 0x04040101, 0x00000001,
99     0x00040101, 0x04000001, 0x04000000, 0x04040101,
100     0x00040000, 0x04000100, 0x04000101, 0x00040100,
101     0x04000100, 0x00000000, 0x04040001, 0x00000101,
102     0x04000001, 0x00040101, 0x00000100, 0x04040000,
103   },
104   {
105     0x00401008, 0x10001000, 0x00000008, 0x10401008,
106     0x00000000, 0x10400000, 0x10001008, 0x00400008,
107     0x10401000, 0x10000008, 0x10000000, 0x00001008,
108     0x10000008, 0x00401008, 0x00400000, 0x10000000,
109     0x10400008, 0x00401000, 0x00001000, 0x00000008,
110     0x00401000, 0x10001008, 0x10400000, 0x00001000,
111     0x00001008, 0x00000000, 0x00400008, 0x10401000,
112     0x10001000, 0x10400008, 0x10401008, 0x00400000,
113     0x10400008, 0x00001008, 0x00400000, 0x10000008,
114     0x00401000, 0x10001000, 0x00000008, 0x10400000,
115     0x10001008, 0x00000000, 0x00001000, 0x00400008,
116     0x00000000, 0x10400008, 0x10401000, 0x00001000,
117     0x10000000, 0x10401008, 0x00401008, 0x00400000,
118     0x10401008, 0x00000008, 0x10001000, 0x00401008,
119     0x00400008, 0x00401000, 0x10400000, 0x10001008,
120     0x00001008, 0x10000000, 0x10000008, 0x10401000,
121   },
122   {
123     0x08000000, 0x00010000, 0x00000400, 0x08010420,
124     0x08010020, 0x08000400, 0x00010420, 0x08010000,
125     0x00010000, 0x00000020, 0x08000020, 0x00010400,
126     0x08000420, 0x08010020, 0x08010400, 0x00000000,
127     0x00010400, 0x08000000, 0x00010020, 0x00000420,
128     0x08000400, 0x00010420, 0x00000000, 0x08000020,
129     0x00000020, 0x08000420, 0x08010420, 0x00010020,
130     0x08010000, 0x00000400, 0x00000420, 0x08010400,
131     0x08010400, 0x08000420, 0x00010020, 0x08010000,
132     0x00010000, 0x00000020, 0x08000020, 0x08000400,
133     0x08000000, 0x00010400, 0x08010420, 0x00000000,
134     0x00010420, 0x08000000, 0x00000400, 0x00010020,
135     0x08000420, 0x00000400, 0x00000000, 0x08010420,
136     0x08010020, 0x08010400, 0x00000420, 0x00010000,
137     0x00010400, 0x08010020, 0x08000400, 0x00000420,
138     0x00000020, 0x00010420, 0x08010000, 0x08000020,
139   },
140   {
141     0x80000040, 0x00200040, 0x00000000, 0x80202000,
142     0x00200040, 0x00002000, 0x80002040, 0x00200000,
143     0x00002040, 0x80202040, 0x00202000, 0x80000000,
144     0x80002000, 0x80000040, 0x80200000, 0x00202040,
145     0x00200000, 0x80002040, 0x80200040, 0x00000000,
146     0x00002000, 0x00000040, 0x80202000, 0x80200040,
147     0x80202040, 0x80200000, 0x80000000, 0x00002040,
148     0x00000040, 0x00202000, 0x00202040, 0x80002000,
149     0x00002040, 0x80000000, 0x80002000, 0x00202040,
150     0x80202000, 0x00200040, 0x00000000, 0x80002000,
151     0x80000000, 0x00002000, 0x80200040, 0x00200000,
152     0x00200040, 0x80202040, 0x00202000, 0x00000040,
153     0x80202040, 0x00202000, 0x00200000, 0x80002040,
154     0x80000040, 0x80200000, 0x00202040, 0x00000000,
155     0x00002000, 0x80000040, 0x80002040, 0x80202000,
156     0x80200000, 0x00002040, 0x00000040, 0x80200040,
157   },
158   {
159     0x00004000, 0x00000200, 0x01000200, 0x01000004,
160     0x01004204, 0x00004004, 0x00004200, 0x00000000,
161     0x01000000, 0x01000204, 0x00000204, 0x01004000,
162     0x00000004, 0x01004200, 0x01004000, 0x00000204,
163     0x01000204, 0x00004000, 0x00004004, 0x01004204,
164     0x00000000, 0x01000200, 0x01000004, 0x00004200,
165     0x01004004, 0x00004204, 0x01004200, 0x00000004,
166     0x00004204, 0x01004004, 0x00000200, 0x01000000,
167     0x00004204, 0x01004000, 0x01004004, 0x00000204,
168     0x00004000, 0x00000200, 0x01000000, 0x01004004,
169     0x01000204, 0x00004204, 0x00004200, 0x00000000,
170     0x00000200, 0x01000004, 0x00000004, 0x01000200,
171     0x00000000, 0x01000204, 0x01000200, 0x00004200,
172     0x00000204, 0x00004000, 0x01004204, 0x01000000,
173     0x01004200, 0x00000004, 0x00004004, 0x01004204,
174     0x01000004, 0x01004200, 0x01004000, 0x00004004,
175   },
176   {
177     0x20800080, 0x20820000, 0x00020080, 0x00000000,
178     0x20020000, 0x00800080, 0x20800000, 0x20820080,
179     0x00000080, 0x20000000, 0x00820000, 0x00020080,
180     0x00820080, 0x20020080, 0x20000080, 0x20800000,
181     0x00020000, 0x00820080, 0x00800080, 0x20020000,
182     0x20820080, 0x20000080, 0x00000000, 0x00820000,
183     0x20000000, 0x00800000, 0x20020080, 0x20800080,
184     0x00800000, 0x00020000, 0x20820000, 0x00000080,
185     0x00800000, 0x00020000, 0x20000080, 0x20820080,
186     0x00020080, 0x20000000, 0x00000000, 0x00820000,
187     0x20800080, 0x20020080, 0x20020000, 0x00800080,
188     0x20820000, 0x00000080, 0x00800080, 0x20020000,
189     0x20820080, 0x00800000, 0x20800000, 0x20000080,
190     0x00820000, 0x00020080, 0x20020080, 0x20800000,
191     0x00000080, 0x20820000, 0x00820080, 0x00000000,
192     0x20000000, 0x20800080, 0x00020000, 0x00820080,
193   }
194 };
195
196 __constant u32 c_skb[8][64] =
197 {
198   {
199     0x00000000, 0x00000010, 0x20000000, 0x20000010,
200     0x00010000, 0x00010010, 0x20010000, 0x20010010,
201     0x00000800, 0x00000810, 0x20000800, 0x20000810,
202     0x00010800, 0x00010810, 0x20010800, 0x20010810,
203     0x00000020, 0x00000030, 0x20000020, 0x20000030,
204     0x00010020, 0x00010030, 0x20010020, 0x20010030,
205     0x00000820, 0x00000830, 0x20000820, 0x20000830,
206     0x00010820, 0x00010830, 0x20010820, 0x20010830,
207     0x00080000, 0x00080010, 0x20080000, 0x20080010,
208     0x00090000, 0x00090010, 0x20090000, 0x20090010,
209     0x00080800, 0x00080810, 0x20080800, 0x20080810,
210     0x00090800, 0x00090810, 0x20090800, 0x20090810,
211     0x00080020, 0x00080030, 0x20080020, 0x20080030,
212     0x00090020, 0x00090030, 0x20090020, 0x20090030,
213     0x00080820, 0x00080830, 0x20080820, 0x20080830,
214     0x00090820, 0x00090830, 0x20090820, 0x20090830,
215   },
216   {
217     0x00000000, 0x02000000, 0x00002000, 0x02002000,
218     0x00200000, 0x02200000, 0x00202000, 0x02202000,
219     0x00000004, 0x02000004, 0x00002004, 0x02002004,
220     0x00200004, 0x02200004, 0x00202004, 0x02202004,
221     0x00000400, 0x02000400, 0x00002400, 0x02002400,
222     0x00200400, 0x02200400, 0x00202400, 0x02202400,
223     0x00000404, 0x02000404, 0x00002404, 0x02002404,
224     0x00200404, 0x02200404, 0x00202404, 0x02202404,
225     0x10000000, 0x12000000, 0x10002000, 0x12002000,
226     0x10200000, 0x12200000, 0x10202000, 0x12202000,
227     0x10000004, 0x12000004, 0x10002004, 0x12002004,
228     0x10200004, 0x12200004, 0x10202004, 0x12202004,
229     0x10000400, 0x12000400, 0x10002400, 0x12002400,
230     0x10200400, 0x12200400, 0x10202400, 0x12202400,
231     0x10000404, 0x12000404, 0x10002404, 0x12002404,
232     0x10200404, 0x12200404, 0x10202404, 0x12202404,
233   },
234   {
235     0x00000000, 0x00000001, 0x00040000, 0x00040001,
236     0x01000000, 0x01000001, 0x01040000, 0x01040001,
237     0x00000002, 0x00000003, 0x00040002, 0x00040003,
238     0x01000002, 0x01000003, 0x01040002, 0x01040003,
239     0x00000200, 0x00000201, 0x00040200, 0x00040201,
240     0x01000200, 0x01000201, 0x01040200, 0x01040201,
241     0x00000202, 0x00000203, 0x00040202, 0x00040203,
242     0x01000202, 0x01000203, 0x01040202, 0x01040203,
243     0x08000000, 0x08000001, 0x08040000, 0x08040001,
244     0x09000000, 0x09000001, 0x09040000, 0x09040001,
245     0x08000002, 0x08000003, 0x08040002, 0x08040003,
246     0x09000002, 0x09000003, 0x09040002, 0x09040003,
247     0x08000200, 0x08000201, 0x08040200, 0x08040201,
248     0x09000200, 0x09000201, 0x09040200, 0x09040201,
249     0x08000202, 0x08000203, 0x08040202, 0x08040203,
250     0x09000202, 0x09000203, 0x09040202, 0x09040203,
251   },
252   {
253     0x00000000, 0x00100000, 0x00000100, 0x00100100,
254     0x00000008, 0x00100008, 0x00000108, 0x00100108,
255     0x00001000, 0x00101000, 0x00001100, 0x00101100,
256     0x00001008, 0x00101008, 0x00001108, 0x00101108,
257     0x04000000, 0x04100000, 0x04000100, 0x04100100,
258     0x04000008, 0x04100008, 0x04000108, 0x04100108,
259     0x04001000, 0x04101000, 0x04001100, 0x04101100,
260     0x04001008, 0x04101008, 0x04001108, 0x04101108,
261     0x00020000, 0x00120000, 0x00020100, 0x00120100,
262     0x00020008, 0x00120008, 0x00020108, 0x00120108,
263     0x00021000, 0x00121000, 0x00021100, 0x00121100,
264     0x00021008, 0x00121008, 0x00021108, 0x00121108,
265     0x04020000, 0x04120000, 0x04020100, 0x04120100,
266     0x04020008, 0x04120008, 0x04020108, 0x04120108,
267     0x04021000, 0x04121000, 0x04021100, 0x04121100,
268     0x04021008, 0x04121008, 0x04021108, 0x04121108,
269   },
270   {
271     0x00000000, 0x10000000, 0x00010000, 0x10010000,
272     0x00000004, 0x10000004, 0x00010004, 0x10010004,
273     0x20000000, 0x30000000, 0x20010000, 0x30010000,
274     0x20000004, 0x30000004, 0x20010004, 0x30010004,
275     0x00100000, 0x10100000, 0x00110000, 0x10110000,
276     0x00100004, 0x10100004, 0x00110004, 0x10110004,
277     0x20100000, 0x30100000, 0x20110000, 0x30110000,
278     0x20100004, 0x30100004, 0x20110004, 0x30110004,
279     0x00001000, 0x10001000, 0x00011000, 0x10011000,
280     0x00001004, 0x10001004, 0x00011004, 0x10011004,
281     0x20001000, 0x30001000, 0x20011000, 0x30011000,
282     0x20001004, 0x30001004, 0x20011004, 0x30011004,
283     0x00101000, 0x10101000, 0x00111000, 0x10111000,
284     0x00101004, 0x10101004, 0x00111004, 0x10111004,
285     0x20101000, 0x30101000, 0x20111000, 0x30111000,
286     0x20101004, 0x30101004, 0x20111004, 0x30111004,
287   },
288   {
289     0x00000000, 0x08000000, 0x00000008, 0x08000008,
290     0x00000400, 0x08000400, 0x00000408, 0x08000408,
291     0x00020000, 0x08020000, 0x00020008, 0x08020008,
292     0x00020400, 0x08020400, 0x00020408, 0x08020408,
293     0x00000001, 0x08000001, 0x00000009, 0x08000009,
294     0x00000401, 0x08000401, 0x00000409, 0x08000409,
295     0x00020001, 0x08020001, 0x00020009, 0x08020009,
296     0x00020401, 0x08020401, 0x00020409, 0x08020409,
297     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
298     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
299     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
300     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
301     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
302     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
303     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
304     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
305   },
306   {
307     0x00000000, 0x00000100, 0x00080000, 0x00080100,
308     0x01000000, 0x01000100, 0x01080000, 0x01080100,
309     0x00000010, 0x00000110, 0x00080010, 0x00080110,
310     0x01000010, 0x01000110, 0x01080010, 0x01080110,
311     0x00200000, 0x00200100, 0x00280000, 0x00280100,
312     0x01200000, 0x01200100, 0x01280000, 0x01280100,
313     0x00200010, 0x00200110, 0x00280010, 0x00280110,
314     0x01200010, 0x01200110, 0x01280010, 0x01280110,
315     0x00000200, 0x00000300, 0x00080200, 0x00080300,
316     0x01000200, 0x01000300, 0x01080200, 0x01080300,
317     0x00000210, 0x00000310, 0x00080210, 0x00080310,
318     0x01000210, 0x01000310, 0x01080210, 0x01080310,
319     0x00200200, 0x00200300, 0x00280200, 0x00280300,
320     0x01200200, 0x01200300, 0x01280200, 0x01280300,
321     0x00200210, 0x00200310, 0x00280210, 0x00280310,
322     0x01200210, 0x01200310, 0x01280210, 0x01280310,
323   },
324   {
325     0x00000000, 0x04000000, 0x00040000, 0x04040000,
326     0x00000002, 0x04000002, 0x00040002, 0x04040002,
327     0x00002000, 0x04002000, 0x00042000, 0x04042000,
328     0x00002002, 0x04002002, 0x00042002, 0x04042002,
329     0x00000020, 0x04000020, 0x00040020, 0x04040020,
330     0x00000022, 0x04000022, 0x00040022, 0x04040022,
331     0x00002020, 0x04002020, 0x00042020, 0x04042020,
332     0x00002022, 0x04002022, 0x00042022, 0x04042022,
333     0x00000800, 0x04000800, 0x00040800, 0x04040800,
334     0x00000802, 0x04000802, 0x00040802, 0x04040802,
335     0x00002800, 0x04002800, 0x00042800, 0x04042800,
336     0x00002802, 0x04002802, 0x00042802, 0x04042802,
337     0x00000820, 0x04000820, 0x00040820, 0x04040820,
338     0x00000822, 0x04000822, 0x00040822, 0x04040822,
339     0x00002820, 0x04002820, 0x00042820, 0x04042820,
340     0x00002822, 0x04002822, 0x00042822, 0x04042822
341   }
342 };
343
344 #if   VECT_SIZE == 1
345 #define BOX(i,n,S) (S)[(n)][(i)]
346 #elif VECT_SIZE == 2
347 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1])
348 #elif VECT_SIZE == 4
349 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3])
350 #elif VECT_SIZE == 8
351 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7])
352 #elif VECT_SIZE == 16
353 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7], (S)[(n)][(i).s8], (S)[(n)][(i).s9], (S)[(n)][(i).sa], (S)[(n)][(i).sb], (S)[(n)][(i).sc], (S)[(n)][(i).sd], (S)[(n)][(i).se], (S)[(n)][(i).sf])
354 #endif
355
356 void _des_crypt_encrypt (u32x iv[2], u32x data[2], u32x Kc[16], u32x Kd[16], __local u32 (*s_SPtrans)[64])
357 {
358   u32x r = data[0];
359   u32x l = data[1];
360
361   #pragma unroll 16
362   for (u32 i = 0; i < 16; i += 2)
363   {
364     u32x u;
365     u32x t;
366
367     u = Kc[i + 0] ^ rotl32 (r, 30u);
368     t = Kd[i + 0] ^ rotl32 (r, 26u);
369
370     l ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
371        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
372        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
373        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
374        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
375        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
376        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
377        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
378
379     u = Kc[i + 1] ^ rotl32 (l, 30u);
380     t = Kd[i + 1] ^ rotl32 (l, 26u);
381
382     r ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
383        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
384        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
385        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
386        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
387        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
388        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
389        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
390   }
391
392   iv[0] = l;
393   iv[1] = r;
394 }
395
396 void _des_crypt_keysetup (u32x c, u32x d, u32x Kc[16], u32x Kd[16], __local u32 (*s_skb)[64])
397 {
398   u32x tt;
399
400   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
401   HPERM_OP (c,    tt, 2, 0xcccc0000);
402   HPERM_OP (d,    tt, 2, 0xcccc0000);
403   PERM_OP  (d, c, tt, 1, 0x55555555);
404   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
405   PERM_OP  (d, c, tt, 1, 0x55555555);
406
407   d = ((d & 0x000000ff) << 16)
408     | ((d & 0x0000ff00) <<  0)
409     | ((d & 0x00ff0000) >> 16)
410     | ((c & 0xf0000000) >>  4);
411
412   c = c & 0x0fffffff;
413
414   #pragma unroll 16
415   for (u32 i = 0; i < 16; i++)
416   {
417     if ((i < 2) || (i == 8) || (i == 15))
418     {
419       c = ((c >> 1) | (c << 27));
420       d = ((d >> 1) | (d << 27));
421     }
422     else
423     {
424       c = ((c >> 2) | (c << 26));
425       d = ((d >> 2) | (d << 26));
426     }
427
428     c = c & 0x0fffffff;
429     d = d & 0x0fffffff;
430
431     const u32x c00 = (c >>  0) & 0x0000003f;
432     const u32x c06 = (c >>  6) & 0x00383003;
433     const u32x c07 = (c >>  7) & 0x0000003c;
434     const u32x c13 = (c >> 13) & 0x0000060f;
435     const u32x c20 = (c >> 20) & 0x00000001;
436
437     u32x s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
438            | BOX (((c06 >>  0) & 0xff)
439                  |((c07 >>  0) & 0xff), 1, s_skb)
440            | BOX (((c13 >>  0) & 0xff)
441                  |((c06 >>  8) & 0xff), 2, s_skb)
442            | BOX (((c20 >>  0) & 0xff)
443                  |((c13 >>  8) & 0xff)
444                  |((c06 >> 16) & 0xff), 3, s_skb);
445
446     const u32x d00 = (d >>  0) & 0x00003c3f;
447     const u32x d07 = (d >>  7) & 0x00003f03;
448     const u32x d21 = (d >> 21) & 0x0000000f;
449     const u32x d22 = (d >> 22) & 0x00000030;
450
451     u32x t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
452            | BOX (((d07 >>  0) & 0xff)
453                  |((d00 >>  8) & 0xff), 5, s_skb)
454            | BOX (((d07 >>  8) & 0xff), 6, s_skb)
455            | BOX (((d21 >>  0) & 0xff)
456                  |((d22 >>  0) & 0xff), 7, s_skb);
457
458     Kc[i] = ((t << 16) | (s & 0x0000ffff));
459     Kd[i] = ((s >> 16) | (t & 0xffff0000));
460   }
461 }
462
463 void transform_netntlmv1_key (const u32x w0, const u32x w1, u32x out[2])
464 {
465   u32x t[8];
466
467   t[0] = (w0 >>  0) & 0xff;
468   t[1] = (w0 >>  8) & 0xff;
469   t[2] = (w0 >> 16) & 0xff;
470   t[3] = (w0 >> 24) & 0xff;
471   t[4] = (w1 >>  0) & 0xff;
472   t[5] = (w1 >>  8) & 0xff;
473   t[6] = (w1 >> 16) & 0xff;
474   t[7] = (w1 >> 24) & 0xff;
475
476   u32x k[8];
477
478   k[0] =               (t[0] >> 0);
479   k[1] = (t[0] << 7) | (t[1] >> 1);
480   k[2] = (t[1] << 6) | (t[2] >> 2);
481   k[3] = (t[2] << 5) | (t[3] >> 3);
482   k[4] = (t[3] << 4) | (t[4] >> 4);
483   k[5] = (t[4] << 3) | (t[5] >> 5);
484   k[6] = (t[5] << 2) | (t[6] >> 6);
485   k[7] = (t[6] << 1);
486
487   out[0] = ((k[0] & 0xff) <<  0)
488          | ((k[1] & 0xff) <<  8)
489          | ((k[2] & 0xff) << 16)
490          | ((k[3] & 0xff) << 24);
491
492   out[1] = ((k[4] & 0xff) <<  0)
493          | ((k[5] & 0xff) <<  8)
494          | ((k[6] & 0xff) << 16)
495          | ((k[7] & 0xff) << 24);
496 }
497
498 __kernel void m05500_m04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
499 {
500   /**
501    * modifier
502    */
503
504   const u32 gid = get_global_id (0);
505   const u32 lid = get_local_id (0);
506   const u32 lsz = get_local_size (0);
507
508   /**
509    * sbox, kbox
510    */
511
512   __local u32 s_SPtrans[8][64];
513   __local u32 s_skb[8][64];
514
515   for (u32 i = lid; i < 64; i += lsz)
516   {
517     s_SPtrans[0][i] = c_SPtrans[0][i];
518     s_SPtrans[1][i] = c_SPtrans[1][i];
519     s_SPtrans[2][i] = c_SPtrans[2][i];
520     s_SPtrans[3][i] = c_SPtrans[3][i];
521     s_SPtrans[4][i] = c_SPtrans[4][i];
522     s_SPtrans[5][i] = c_SPtrans[5][i];
523     s_SPtrans[6][i] = c_SPtrans[6][i];
524     s_SPtrans[7][i] = c_SPtrans[7][i];
525
526     s_skb[0][i] = c_skb[0][i];
527     s_skb[1][i] = c_skb[1][i];
528     s_skb[2][i] = c_skb[2][i];
529     s_skb[3][i] = c_skb[3][i];
530     s_skb[4][i] = c_skb[4][i];
531     s_skb[5][i] = c_skb[5][i];
532     s_skb[6][i] = c_skb[6][i];
533     s_skb[7][i] = c_skb[7][i];
534   }
535
536   barrier (CLK_LOCAL_MEM_FENCE);
537
538   if (gid >= gid_max) return;
539
540   /**
541    * base
542    */
543
544   u32 pw_buf0[4];
545   u32 pw_buf1[4];
546
547   pw_buf0[0] = pws[gid].i[0];
548   pw_buf0[1] = pws[gid].i[1];
549   pw_buf0[2] = pws[gid].i[2];
550   pw_buf0[3] = pws[gid].i[3];
551   pw_buf1[0] = pws[gid].i[4];
552   pw_buf1[1] = pws[gid].i[5];
553   pw_buf1[2] = pws[gid].i[6];
554   pw_buf1[3] = pws[gid].i[7];
555
556   const u32 pw_len = pws[gid].pw_len;
557
558   /**
559    * salt
560    */
561
562   const u32 s0 = salt_bufs[salt_pos].salt_buf[0];
563   const u32 s1 = salt_bufs[salt_pos].salt_buf[1];
564   const u32 s2 = salt_bufs[salt_pos].salt_buf[2];
565
566   u32 data[2];
567
568   data[0] = s0;
569   data[1] = s1;
570
571   /**
572    * loop
573    */
574
575   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
576   {
577     u32x w0[4] = { 0 };
578     u32x w1[4] = { 0 };
579     u32x w2[4] = { 0 };
580     u32x w3[4] = { 0 };
581
582     const u32x out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
583
584     append_0x80_2x4_VV (w0, w1, out_len);
585
586     u32x w0_t[4];
587     u32x w1_t[4];
588     u32x w2_t[4];
589     u32x w3_t[4];
590
591     make_unicode (w0, w0_t, w1_t);
592     make_unicode (w1, w2_t, w3_t);
593
594     w3_t[2] = out_len * 8 * 2;
595     w3_t[3] = 0;
596
597     u32x a = MD4M_A;
598     u32x b = MD4M_B;
599     u32x c = MD4M_C;
600     u32x d = MD4M_D;
601
602     MD4_STEP (MD4_Fo, a, b, c, d, w0_t[0], MD4C00, MD4S00);
603     MD4_STEP (MD4_Fo, d, a, b, c, w0_t[1], MD4C00, MD4S01);
604     MD4_STEP (MD4_Fo, c, d, a, b, w0_t[2], MD4C00, MD4S02);
605     MD4_STEP (MD4_Fo, b, c, d, a, w0_t[3], MD4C00, MD4S03);
606     MD4_STEP (MD4_Fo, a, b, c, d, w1_t[0], MD4C00, MD4S00);
607     MD4_STEP (MD4_Fo, d, a, b, c, w1_t[1], MD4C00, MD4S01);
608     MD4_STEP (MD4_Fo, c, d, a, b, w1_t[2], MD4C00, MD4S02);
609     MD4_STEP (MD4_Fo, b, c, d, a, w1_t[3], MD4C00, MD4S03);
610     MD4_STEP (MD4_Fo, a, b, c, d, w2_t[0], MD4C00, MD4S00);
611     MD4_STEP (MD4_Fo, d, a, b, c, w2_t[1], MD4C00, MD4S01);
612     MD4_STEP (MD4_Fo, c, d, a, b, w2_t[2], MD4C00, MD4S02);
613     MD4_STEP (MD4_Fo, b, c, d, a, w2_t[3], MD4C00, MD4S03);
614     MD4_STEP (MD4_Fo, a, b, c, d, w3_t[0], MD4C00, MD4S00);
615     MD4_STEP (MD4_Fo, d, a, b, c, w3_t[1], MD4C00, MD4S01);
616     MD4_STEP (MD4_Fo, c, d, a, b, w3_t[2], MD4C00, MD4S02);
617     MD4_STEP (MD4_Fo, b, c, d, a, w3_t[3], MD4C00, MD4S03);
618
619     MD4_STEP (MD4_Go, a, b, c, d, w0_t[0], MD4C01, MD4S10);
620     MD4_STEP (MD4_Go, d, a, b, c, w1_t[0], MD4C01, MD4S11);
621     MD4_STEP (MD4_Go, c, d, a, b, w2_t[0], MD4C01, MD4S12);
622     MD4_STEP (MD4_Go, b, c, d, a, w3_t[0], MD4C01, MD4S13);
623     MD4_STEP (MD4_Go, a, b, c, d, w0_t[1], MD4C01, MD4S10);
624     MD4_STEP (MD4_Go, d, a, b, c, w1_t[1], MD4C01, MD4S11);
625     MD4_STEP (MD4_Go, c, d, a, b, w2_t[1], MD4C01, MD4S12);
626     MD4_STEP (MD4_Go, b, c, d, a, w3_t[1], MD4C01, MD4S13);
627     MD4_STEP (MD4_Go, a, b, c, d, w0_t[2], MD4C01, MD4S10);
628     MD4_STEP (MD4_Go, d, a, b, c, w1_t[2], MD4C01, MD4S11);
629     MD4_STEP (MD4_Go, c, d, a, b, w2_t[2], MD4C01, MD4S12);
630     MD4_STEP (MD4_Go, b, c, d, a, w3_t[2], MD4C01, MD4S13);
631     MD4_STEP (MD4_Go, a, b, c, d, w0_t[3], MD4C01, MD4S10);
632     MD4_STEP (MD4_Go, d, a, b, c, w1_t[3], MD4C01, MD4S11);
633     MD4_STEP (MD4_Go, c, d, a, b, w2_t[3], MD4C01, MD4S12);
634     MD4_STEP (MD4_Go, b, c, d, a, w3_t[3], MD4C01, MD4S13);
635
636     MD4_STEP (MD4_H , a, b, c, d, w0_t[0], MD4C02, MD4S20);
637     MD4_STEP (MD4_H , d, a, b, c, w2_t[0], MD4C02, MD4S21);
638     MD4_STEP (MD4_H , c, d, a, b, w1_t[0], MD4C02, MD4S22);
639     MD4_STEP (MD4_H , b, c, d, a, w3_t[0], MD4C02, MD4S23);
640     MD4_STEP (MD4_H , a, b, c, d, w0_t[2], MD4C02, MD4S20);
641     MD4_STEP (MD4_H , d, a, b, c, w2_t[2], MD4C02, MD4S21);
642     MD4_STEP (MD4_H , c, d, a, b, w1_t[2], MD4C02, MD4S22);
643     MD4_STEP (MD4_H , b, c, d, a, w3_t[2], MD4C02, MD4S23);
644     MD4_STEP (MD4_H , a, b, c, d, w0_t[1], MD4C02, MD4S20);
645     MD4_STEP (MD4_H , d, a, b, c, w2_t[1], MD4C02, MD4S21);
646     MD4_STEP (MD4_H , c, d, a, b, w1_t[1], MD4C02, MD4S22);
647     MD4_STEP (MD4_H , b, c, d, a, w3_t[1], MD4C02, MD4S23);
648     MD4_STEP (MD4_H , a, b, c, d, w0_t[3], MD4C02, MD4S20);
649     MD4_STEP (MD4_H , d, a, b, c, w2_t[3], MD4C02, MD4S21);
650
651     if (MATCHES_NONE_VS (((d + MD4M_D) >> 16), s2)) continue;
652
653     MD4_STEP (MD4_H , c, d, a, b, w1_t[3], MD4C02, MD4S22);
654     MD4_STEP (MD4_H , b, c, d, a, w3_t[3], MD4C02, MD4S23);
655
656     a += MD4M_A;
657     b += MD4M_B;
658     c += MD4M_C;
659     d += MD4M_D;
660
661     /**
662      * DES1
663      */
664
665     u32x key[2];
666
667     transform_netntlmv1_key (a, b, key);
668
669     u32x Kc[16];
670     u32x Kd[16];
671
672     _des_crypt_keysetup (key[0], key[1], Kc, Kd, s_skb);
673
674     u32x data[2];
675
676     data[0] = s0;
677     data[1] = s1;
678
679     u32x iv1[2];
680
681     _des_crypt_encrypt (iv1, data, Kc, Kd, s_SPtrans);
682
683     /**
684      * DES2
685      */
686
687     transform_netntlmv1_key (((b >> 24) | (c << 8)), ((c >> 24) | (d << 8)), key);
688
689     _des_crypt_keysetup (key[0], key[1], Kc, Kd, s_skb);
690
691     u32x iv2[2];
692
693     _des_crypt_encrypt (iv2, data, Kc, Kd, s_SPtrans);
694
695     /**
696      * compare
697      */
698
699     COMPARE_M_SIMD (iv1[0], iv1[1], iv2[0], iv2[1]);
700   }
701 }
702
703 __kernel void m05500_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
704 {
705 }
706
707 __kernel void m05500_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
708 {
709 }
710
711 __kernel void m05500_s04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
712 {
713   /**
714    * modifier
715    */
716
717   const u32 gid = get_global_id (0);
718   const u32 lid = get_local_id (0);
719   const u32 lsz = get_local_size (0);
720
721   /**
722    * sbox, kbox
723    */
724
725   __local u32 s_SPtrans[8][64];
726   __local u32 s_skb[8][64];
727
728   for (u32 i = lid; i < 64; i += lsz)
729   {
730     s_SPtrans[0][i] = c_SPtrans[0][i];
731     s_SPtrans[1][i] = c_SPtrans[1][i];
732     s_SPtrans[2][i] = c_SPtrans[2][i];
733     s_SPtrans[3][i] = c_SPtrans[3][i];
734     s_SPtrans[4][i] = c_SPtrans[4][i];
735     s_SPtrans[5][i] = c_SPtrans[5][i];
736     s_SPtrans[6][i] = c_SPtrans[6][i];
737     s_SPtrans[7][i] = c_SPtrans[7][i];
738
739     s_skb[0][i] = c_skb[0][i];
740     s_skb[1][i] = c_skb[1][i];
741     s_skb[2][i] = c_skb[2][i];
742     s_skb[3][i] = c_skb[3][i];
743     s_skb[4][i] = c_skb[4][i];
744     s_skb[5][i] = c_skb[5][i];
745     s_skb[6][i] = c_skb[6][i];
746     s_skb[7][i] = c_skb[7][i];
747   }
748
749   barrier (CLK_LOCAL_MEM_FENCE);
750
751   if (gid >= gid_max) return;
752
753   /**
754    * base
755    */
756
757   u32 pw_buf0[4];
758   u32 pw_buf1[4];
759
760   pw_buf0[0] = pws[gid].i[0];
761   pw_buf0[1] = pws[gid].i[1];
762   pw_buf0[2] = pws[gid].i[2];
763   pw_buf0[3] = pws[gid].i[3];
764   pw_buf1[0] = pws[gid].i[4];
765   pw_buf1[1] = pws[gid].i[5];
766   pw_buf1[2] = pws[gid].i[6];
767   pw_buf1[3] = pws[gid].i[7];
768
769   const u32 pw_len = pws[gid].pw_len;
770
771   /**
772    * salt
773    */
774
775   const u32 s0 = salt_bufs[salt_pos].salt_buf[0];
776   const u32 s1 = salt_bufs[salt_pos].salt_buf[1];
777   const u32 s2 = salt_bufs[salt_pos].salt_buf[2];
778
779   /**
780    * digest
781    */
782
783   const u32 search[4] =
784   {
785     digests_buf[digests_offset].digest_buf[DGST_R0],
786     digests_buf[digests_offset].digest_buf[DGST_R1],
787     digests_buf[digests_offset].digest_buf[DGST_R2],
788     digests_buf[digests_offset].digest_buf[DGST_R3]
789   };
790
791   /**
792    * loop
793    */
794
795   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
796   {
797     u32x w0[4] = { 0 };
798     u32x w1[4] = { 0 };
799     u32x w2[4] = { 0 };
800     u32x w3[4] = { 0 };
801
802     const u32x out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
803
804     append_0x80_2x4_VV (w0, w1, out_len);
805
806     u32x w0_t[4];
807     u32x w1_t[4];
808     u32x w2_t[4];
809     u32x w3_t[4];
810
811     make_unicode (w0, w0_t, w1_t);
812     make_unicode (w1, w2_t, w3_t);
813
814     w3_t[2] = out_len * 8 * 2;
815     w3_t[3] = 0;
816
817     u32x a = MD4M_A;
818     u32x b = MD4M_B;
819     u32x c = MD4M_C;
820     u32x d = MD4M_D;
821
822     MD4_STEP (MD4_Fo, a, b, c, d, w0_t[0], MD4C00, MD4S00);
823     MD4_STEP (MD4_Fo, d, a, b, c, w0_t[1], MD4C00, MD4S01);
824     MD4_STEP (MD4_Fo, c, d, a, b, w0_t[2], MD4C00, MD4S02);
825     MD4_STEP (MD4_Fo, b, c, d, a, w0_t[3], MD4C00, MD4S03);
826     MD4_STEP (MD4_Fo, a, b, c, d, w1_t[0], MD4C00, MD4S00);
827     MD4_STEP (MD4_Fo, d, a, b, c, w1_t[1], MD4C00, MD4S01);
828     MD4_STEP (MD4_Fo, c, d, a, b, w1_t[2], MD4C00, MD4S02);
829     MD4_STEP (MD4_Fo, b, c, d, a, w1_t[3], MD4C00, MD4S03);
830     MD4_STEP (MD4_Fo, a, b, c, d, w2_t[0], MD4C00, MD4S00);
831     MD4_STEP (MD4_Fo, d, a, b, c, w2_t[1], MD4C00, MD4S01);
832     MD4_STEP (MD4_Fo, c, d, a, b, w2_t[2], MD4C00, MD4S02);
833     MD4_STEP (MD4_Fo, b, c, d, a, w2_t[3], MD4C00, MD4S03);
834     MD4_STEP (MD4_Fo, a, b, c, d, w3_t[0], MD4C00, MD4S00);
835     MD4_STEP (MD4_Fo, d, a, b, c, w3_t[1], MD4C00, MD4S01);
836     MD4_STEP (MD4_Fo, c, d, a, b, w3_t[2], MD4C00, MD4S02);
837     MD4_STEP (MD4_Fo, b, c, d, a, w3_t[3], MD4C00, MD4S03);
838
839     MD4_STEP (MD4_Go, a, b, c, d, w0_t[0], MD4C01, MD4S10);
840     MD4_STEP (MD4_Go, d, a, b, c, w1_t[0], MD4C01, MD4S11);
841     MD4_STEP (MD4_Go, c, d, a, b, w2_t[0], MD4C01, MD4S12);
842     MD4_STEP (MD4_Go, b, c, d, a, w3_t[0], MD4C01, MD4S13);
843     MD4_STEP (MD4_Go, a, b, c, d, w0_t[1], MD4C01, MD4S10);
844     MD4_STEP (MD4_Go, d, a, b, c, w1_t[1], MD4C01, MD4S11);
845     MD4_STEP (MD4_Go, c, d, a, b, w2_t[1], MD4C01, MD4S12);
846     MD4_STEP (MD4_Go, b, c, d, a, w3_t[1], MD4C01, MD4S13);
847     MD4_STEP (MD4_Go, a, b, c, d, w0_t[2], MD4C01, MD4S10);
848     MD4_STEP (MD4_Go, d, a, b, c, w1_t[2], MD4C01, MD4S11);
849     MD4_STEP (MD4_Go, c, d, a, b, w2_t[2], MD4C01, MD4S12);
850     MD4_STEP (MD4_Go, b, c, d, a, w3_t[2], MD4C01, MD4S13);
851     MD4_STEP (MD4_Go, a, b, c, d, w0_t[3], MD4C01, MD4S10);
852     MD4_STEP (MD4_Go, d, a, b, c, w1_t[3], MD4C01, MD4S11);
853     MD4_STEP (MD4_Go, c, d, a, b, w2_t[3], MD4C01, MD4S12);
854     MD4_STEP (MD4_Go, b, c, d, a, w3_t[3], MD4C01, MD4S13);
855
856     MD4_STEP (MD4_H , a, b, c, d, w0_t[0], MD4C02, MD4S20);
857     MD4_STEP (MD4_H , d, a, b, c, w2_t[0], MD4C02, MD4S21);
858     MD4_STEP (MD4_H , c, d, a, b, w1_t[0], MD4C02, MD4S22);
859     MD4_STEP (MD4_H , b, c, d, a, w3_t[0], MD4C02, MD4S23);
860     MD4_STEP (MD4_H , a, b, c, d, w0_t[2], MD4C02, MD4S20);
861     MD4_STEP (MD4_H , d, a, b, c, w2_t[2], MD4C02, MD4S21);
862     MD4_STEP (MD4_H , c, d, a, b, w1_t[2], MD4C02, MD4S22);
863     MD4_STEP (MD4_H , b, c, d, a, w3_t[2], MD4C02, MD4S23);
864     MD4_STEP (MD4_H , a, b, c, d, w0_t[1], MD4C02, MD4S20);
865     MD4_STEP (MD4_H , d, a, b, c, w2_t[1], MD4C02, MD4S21);
866     MD4_STEP (MD4_H , c, d, a, b, w1_t[1], MD4C02, MD4S22);
867     MD4_STEP (MD4_H , b, c, d, a, w3_t[1], MD4C02, MD4S23);
868     MD4_STEP (MD4_H , a, b, c, d, w0_t[3], MD4C02, MD4S20);
869     MD4_STEP (MD4_H , d, a, b, c, w2_t[3], MD4C02, MD4S21);
870
871     if (MATCHES_NONE_VS (((d + MD4M_D) >> 16), s2)) continue;
872
873     MD4_STEP (MD4_H , c, d, a, b, w1_t[3], MD4C02, MD4S22);
874     MD4_STEP (MD4_H , b, c, d, a, w3_t[3], MD4C02, MD4S23);
875
876     a += MD4M_A;
877     b += MD4M_B;
878     c += MD4M_C;
879     d += MD4M_D;
880
881     /**
882      * DES1
883      */
884
885     u32x key[2];
886
887     transform_netntlmv1_key (a, b, key);
888
889     u32x Kc[16];
890     u32x Kd[16];
891
892     _des_crypt_keysetup (key[0], key[1], Kc, Kd, s_skb);
893
894     u32x data[2];
895
896     data[0] = s0;
897     data[1] = s1;
898
899     u32x iv1[2];
900
901     _des_crypt_encrypt (iv1, data, Kc, Kd, s_SPtrans);
902
903     /**
904      * DES2
905      */
906
907     /*
908     transform_netntlmv1_key (((b >> 24) | (c << 8)), ((c >> 24) | (d << 8)), key);
909
910     _des_crypt_keysetup (key[0], key[1], Kc, Kd, s_skb);
911
912     u32x iv2[2];
913
914     _des_crypt_encrypt (iv2, data, Kc, Kd, s_SPtrans);
915     */
916
917     u32x iv2[2];
918
919     iv2[0] = search[2];
920     iv2[1] = search[3];
921
922     /**
923      * compare
924      */
925
926     COMPARE_S_SIMD (iv1[0], iv1[1], iv2[0], iv2[1]);
927   }
928 }
929
930 __kernel void m05500_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
931 {
932 }
933
934 __kernel void m05500_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
935 {
936 }