1b33d2a29f96339b3a93c9c76d0468fe974f3487
[hashcat.git] / OpenCL / m01600.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #include "inc_hash_constants.h"
9 #include "inc_vendor.cl"
10
11 #define DGST_R0 0
12 #define DGST_R1 1
13 #define DGST_R2 2
14 #define DGST_R3 3
15
16 #include "inc_hash_functions.cl"
17 #include "inc_types.cl"
18 #include "inc_common.cl"
19
20 #define COMPARE_S "inc_comp_single.cl"
21 #define COMPARE_M "inc_comp_multi.cl"
22
23 #define md5apr1_magic0 0x72706124u
24 #define md5apr1_magic1 0x00002431u
25
26 void md5_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
27 {
28   u32 a = digest[0];
29   u32 b = digest[1];
30   u32 c = digest[2];
31   u32 d = digest[3];
32
33   u32 w0_t = w0[0];
34   u32 w1_t = w0[1];
35   u32 w2_t = w0[2];
36   u32 w3_t = w0[3];
37   u32 w4_t = w1[0];
38   u32 w5_t = w1[1];
39   u32 w6_t = w1[2];
40   u32 w7_t = w1[3];
41   u32 w8_t = w2[0];
42   u32 w9_t = w2[1];
43   u32 wa_t = w2[2];
44   u32 wb_t = w2[3];
45   u32 wc_t = w3[0];
46   u32 wd_t = w3[1];
47   u32 we_t = w3[2];
48   u32 wf_t = 0;
49
50   MD5_STEP (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
51   MD5_STEP (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
52   MD5_STEP (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
53   MD5_STEP (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
54   MD5_STEP (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
55   MD5_STEP (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
56   MD5_STEP (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
57   MD5_STEP (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
58   MD5_STEP (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
59   MD5_STEP (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
60   MD5_STEP (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
61   MD5_STEP (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
62   MD5_STEP (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
63   MD5_STEP (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
64   MD5_STEP (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
65   MD5_STEP (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
66
67   MD5_STEP (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
68   MD5_STEP (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
69   MD5_STEP (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
70   MD5_STEP (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
71   MD5_STEP (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
72   MD5_STEP (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
73   MD5_STEP (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
74   MD5_STEP (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
75   MD5_STEP (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
76   MD5_STEP (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
77   MD5_STEP (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
78   MD5_STEP (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
79   MD5_STEP (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
80   MD5_STEP (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
81   MD5_STEP (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
82   MD5_STEP (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
83
84   MD5_STEP (MD5_H , a, b, c, d, w5_t, MD5C20, MD5S20);
85   MD5_STEP (MD5_H , d, a, b, c, w8_t, MD5C21, MD5S21);
86   MD5_STEP (MD5_H , c, d, a, b, wb_t, MD5C22, MD5S22);
87   MD5_STEP (MD5_H , b, c, d, a, we_t, MD5C23, MD5S23);
88   MD5_STEP (MD5_H , a, b, c, d, w1_t, MD5C24, MD5S20);
89   MD5_STEP (MD5_H , d, a, b, c, w4_t, MD5C25, MD5S21);
90   MD5_STEP (MD5_H , c, d, a, b, w7_t, MD5C26, MD5S22);
91   MD5_STEP (MD5_H , b, c, d, a, wa_t, MD5C27, MD5S23);
92   MD5_STEP (MD5_H , a, b, c, d, wd_t, MD5C28, MD5S20);
93   MD5_STEP (MD5_H , d, a, b, c, w0_t, MD5C29, MD5S21);
94   MD5_STEP (MD5_H , c, d, a, b, w3_t, MD5C2a, MD5S22);
95   MD5_STEP (MD5_H , b, c, d, a, w6_t, MD5C2b, MD5S23);
96   MD5_STEP (MD5_H , a, b, c, d, w9_t, MD5C2c, MD5S20);
97   MD5_STEP (MD5_H , d, a, b, c, wc_t, MD5C2d, MD5S21);
98   MD5_STEP (MD5_H , c, d, a, b, wf_t, MD5C2e, MD5S22);
99   MD5_STEP (MD5_H , b, c, d, a, w2_t, MD5C2f, MD5S23);
100
101   MD5_STEP (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
102   MD5_STEP (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
103   MD5_STEP (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
104   MD5_STEP (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
105   MD5_STEP (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
106   MD5_STEP (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
107   MD5_STEP (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
108   MD5_STEP (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
109   MD5_STEP (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
110   MD5_STEP (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
111   MD5_STEP (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
112   MD5_STEP (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
113   MD5_STEP (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
114   MD5_STEP (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
115   MD5_STEP (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
116   MD5_STEP (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
117
118   digest[0] += a;
119   digest[1] += b;
120   digest[2] += c;
121   digest[3] += d;
122 }
123
124 void memcat16 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[4])
125 {
126   u32 tmp0;
127   u32 tmp1;
128   u32 tmp2;
129   u32 tmp3;
130   u32 tmp4;
131
132   #if defined IS_AMD || defined IS_GENERIC
133
134   const int offset_minus_4 = 4 - (block_len & 3);
135
136   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
137   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
138   tmp2 = amd_bytealign (append[2], append[1], offset_minus_4);
139   tmp3 = amd_bytealign (append[3], append[2], offset_minus_4);
140   tmp4 = amd_bytealign (        0, append[3], offset_minus_4);
141
142   const u32 mod = block_len & 3;
143
144   if (mod == 0)
145   {
146     tmp0 = tmp1;
147     tmp1 = tmp2;
148     tmp2 = tmp3;
149     tmp3 = tmp4;
150     tmp4 = 0;
151   }
152
153   #endif
154
155   #ifdef IS_NV
156
157   const int offset_minus_4 = 4 - (block_len & 3);
158
159   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
160
161   tmp0 = __byte_perm (        0, append[0], selector);
162   tmp1 = __byte_perm (append[0], append[1], selector);
163   tmp2 = __byte_perm (append[1], append[2], selector);
164   tmp3 = __byte_perm (append[2], append[3], selector);
165   tmp4 = __byte_perm (append[3],         0, selector);
166
167   #endif
168
169   const u32 div = block_len / 4;
170
171   switch (div)
172   {
173     case  0:  block0[0] |= tmp0;
174               block0[1]  = tmp1;
175               block0[2]  = tmp2;
176               block0[3]  = tmp3;
177               block1[0]  = tmp4;
178               break;
179     case  1:  block0[1] |= tmp0;
180               block0[2]  = tmp1;
181               block0[3]  = tmp2;
182               block1[0]  = tmp3;
183               block1[1]  = tmp4;
184               break;
185     case  2:  block0[2] |= tmp0;
186               block0[3]  = tmp1;
187               block1[0]  = tmp2;
188               block1[1]  = tmp3;
189               block1[2]  = tmp4;
190               break;
191     case  3:  block0[3] |= tmp0;
192               block1[0]  = tmp1;
193               block1[1]  = tmp2;
194               block1[2]  = tmp3;
195               block1[3]  = tmp4;
196               break;
197     case  4:  block1[0] |= tmp0;
198               block1[1]  = tmp1;
199               block1[2]  = tmp2;
200               block1[3]  = tmp3;
201               block2[0]  = tmp4;
202               break;
203     case  5:  block1[1] |= tmp0;
204               block1[2]  = tmp1;
205               block1[3]  = tmp2;
206               block2[0]  = tmp3;
207               block2[1]  = tmp4;
208               break;
209     case  6:  block1[2] |= tmp0;
210               block1[3]  = tmp1;
211               block2[0]  = tmp2;
212               block2[1]  = tmp3;
213               block2[2]  = tmp4;
214               break;
215     case  7:  block1[3] |= tmp0;
216               block2[0]  = tmp1;
217               block2[1]  = tmp2;
218               block2[2]  = tmp3;
219               block2[3]  = tmp4;
220               break;
221     case  8:  block2[0] |= tmp0;
222               block2[1]  = tmp1;
223               block2[2]  = tmp2;
224               block2[3]  = tmp3;
225               block3[0]  = tmp4;
226               break;
227     case  9:  block2[1] |= tmp0;
228               block2[2]  = tmp1;
229               block2[3]  = tmp2;
230               block3[0]  = tmp3;
231               block3[1]  = tmp4;
232               break;
233   }
234 }
235
236 void memcat16_x80 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[4])
237 {
238   u32 tmp0;
239   u32 tmp1;
240   u32 tmp2;
241   u32 tmp3;
242   u32 tmp4;
243
244   #if defined IS_AMD || defined IS_GENERIC
245
246   const int offset_minus_4 = 4 - (block_len & 3);
247
248   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
249   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
250   tmp2 = amd_bytealign (append[2], append[1], offset_minus_4);
251   tmp3 = amd_bytealign (append[3], append[2], offset_minus_4);
252   tmp4 = amd_bytealign (     0x80, append[3], offset_minus_4);
253
254   const u32 mod = block_len & 3;
255
256   if (mod == 0)
257   {
258     tmp0 = tmp1;
259     tmp1 = tmp2;
260     tmp2 = tmp3;
261     tmp3 = tmp4;
262     tmp4 = 0x80;
263   }
264
265   #endif
266
267   #ifdef IS_NV
268
269   const int offset_minus_4 = 4 - (block_len & 3);
270
271   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
272
273   tmp0 = __byte_perm (        0, append[0], selector);
274   tmp1 = __byte_perm (append[0], append[1], selector);
275   tmp2 = __byte_perm (append[1], append[2], selector);
276   tmp3 = __byte_perm (append[2], append[3], selector);
277   tmp4 = __byte_perm (append[3],      0x80, selector);
278
279   #endif
280
281   const u32 div = block_len / 4;
282
283   switch (div)
284   {
285     case  0:  block0[0] |= tmp0;
286               block0[1]  = tmp1;
287               block0[2]  = tmp2;
288               block0[3]  = tmp3;
289               block1[0]  = tmp4;
290               break;
291     case  1:  block0[1] |= tmp0;
292               block0[2]  = tmp1;
293               block0[3]  = tmp2;
294               block1[0]  = tmp3;
295               block1[1]  = tmp4;
296               break;
297     case  2:  block0[2] |= tmp0;
298               block0[3]  = tmp1;
299               block1[0]  = tmp2;
300               block1[1]  = tmp3;
301               block1[2]  = tmp4;
302               break;
303     case  3:  block0[3] |= tmp0;
304               block1[0]  = tmp1;
305               block1[1]  = tmp2;
306               block1[2]  = tmp3;
307               block1[3]  = tmp4;
308               break;
309     case  4:  block1[0] |= tmp0;
310               block1[1]  = tmp1;
311               block1[2]  = tmp2;
312               block1[3]  = tmp3;
313               block2[0]  = tmp4;
314               break;
315     case  5:  block1[1] |= tmp0;
316               block1[2]  = tmp1;
317               block1[3]  = tmp2;
318               block2[0]  = tmp3;
319               block2[1]  = tmp4;
320               break;
321     case  6:  block1[2] |= tmp0;
322               block1[3]  = tmp1;
323               block2[0]  = tmp2;
324               block2[1]  = tmp3;
325               block2[2]  = tmp4;
326               break;
327     case  7:  block1[3] |= tmp0;
328               block2[0]  = tmp1;
329               block2[1]  = tmp2;
330               block2[2]  = tmp3;
331               block2[3]  = tmp4;
332               break;
333     case  8:  block2[0] |= tmp0;
334               block2[1]  = tmp1;
335               block2[2]  = tmp2;
336               block2[3]  = tmp3;
337               block3[0]  = tmp4;
338               break;
339     case  9:  block2[1] |= tmp0;
340               block2[2]  = tmp1;
341               block2[3]  = tmp2;
342               block3[0]  = tmp3;
343               block3[1]  = tmp4;
344               break;
345   }
346 }
347
348 void memcat8 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[2])
349 {
350   u32 tmp0;
351   u32 tmp1;
352   u32 tmp2;
353
354   #if defined IS_AMD || defined IS_GENERIC
355
356   const int offset_minus_4 = 4 - (block_len & 3);
357
358   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
359   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
360   tmp2 = amd_bytealign (        0, append[1], offset_minus_4);
361
362   const u32 mod = block_len & 3;
363
364   if (mod == 0)
365   {
366     tmp0 = tmp1;
367     tmp1 = tmp2;
368     tmp2 = 0;
369   }
370
371   #endif
372
373   #ifdef IS_NV
374
375   const int offset_minus_4 = 4 - (block_len & 3);
376
377   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
378
379   tmp0 = __byte_perm (        0, append[0], selector);
380   tmp1 = __byte_perm (append[0], append[1], selector);
381   tmp2 = __byte_perm (append[1],         0, selector);
382
383   #endif
384
385   const u32 div = block_len / 4;
386
387   switch (div)
388   {
389     case  0:  block0[0] |= tmp0;
390               block0[1]  = tmp1;
391               block0[2]  = tmp2;
392               break;
393     case  1:  block0[1] |= tmp0;
394               block0[2]  = tmp1;
395               block0[3]  = tmp2;
396               break;
397     case  2:  block0[2] |= tmp0;
398               block0[3]  = tmp1;
399               block1[0]  = tmp2;
400               break;
401     case  3:  block0[3] |= tmp0;
402               block1[0]  = tmp1;
403               block1[1]  = tmp2;
404               break;
405     case  4:  block1[0] |= tmp0;
406               block1[1]  = tmp1;
407               block1[2]  = tmp2;
408               break;
409     case  5:  block1[1] |= tmp0;
410               block1[2]  = tmp1;
411               block1[3]  = tmp2;
412               break;
413     case  6:  block1[2] |= tmp0;
414               block1[3]  = tmp1;
415               block2[0]  = tmp2;
416               break;
417     case  7:  block1[3] |= tmp0;
418               block2[0]  = tmp1;
419               block2[1]  = tmp2;
420               break;
421     case  8:  block2[0] |= tmp0;
422               block2[1]  = tmp1;
423               block2[2]  = tmp2;
424               break;
425     case  9:  block2[1] |= tmp0;
426               block2[2]  = tmp1;
427               block2[3]  = tmp2;
428               break;
429     case 10:  block2[2] |= tmp0;
430               block2[3]  = tmp1;
431               block3[0]  = tmp2;
432               break;
433     case 11:  block2[3] |= tmp0;
434               block3[0]  = tmp1;
435               block3[1]  = tmp2;
436               break;
437   }
438 }
439
440 void append_sign (u32 block0[4], u32 block1[4], const u32 block_len)
441 {
442   switch (block_len)
443   {
444     case 0:
445       block0[0] = md5apr1_magic0;
446       block0[1] = md5apr1_magic1;
447       break;
448
449     case 1:
450       block0[0] = block0[0]             | md5apr1_magic0 <<  8u;
451       block0[1] = md5apr1_magic0 >> 24u | md5apr1_magic1 <<  8u;
452       block0[2] = md5apr1_magic1 >> 24u;
453       break;
454
455     case 2:
456       block0[0] = block0[0]             | md5apr1_magic0 << 16u;
457       block0[1] = md5apr1_magic0 >> 16u | md5apr1_magic1 << 16u;
458       block0[2] = md5apr1_magic1 >> 16u;
459       break;
460
461     case 3:
462       block0[0] = block0[0]             | md5apr1_magic0 << 24u;
463       block0[1] = md5apr1_magic0 >>  8u | md5apr1_magic1 << 24u;
464       block0[2] = md5apr1_magic1 >>  8u;
465       break;
466
467     case 4:
468       block0[1] = md5apr1_magic0;
469       block0[2] = md5apr1_magic1;
470       break;
471
472     case 5:
473       block0[1] = block0[1]             | md5apr1_magic0 <<  8u;
474       block0[2] = md5apr1_magic0 >> 24u | md5apr1_magic1 <<  8u;
475       block0[3] = md5apr1_magic1 >> 24u;
476       break;
477
478     case 6:
479       block0[1] = block0[1]             | md5apr1_magic0 << 16u;
480       block0[2] = md5apr1_magic0 >> 16u | md5apr1_magic1 << 16u;
481       block0[3] = md5apr1_magic1 >> 16u;
482       break;
483
484     case 7:
485       block0[1] = block0[1]             | md5apr1_magic0 << 24u;
486       block0[2] = md5apr1_magic0 >>  8u | md5apr1_magic1 << 24u;
487       block0[3] = md5apr1_magic1 >>  8u;
488       break;
489
490     case 8:
491       block0[2] = md5apr1_magic0;
492       block0[3] = md5apr1_magic1;
493       break;
494
495     case 9:
496       block0[2] = block0[2]             | md5apr1_magic0 <<  8u;
497       block0[3] = md5apr1_magic0 >> 24u | md5apr1_magic1 <<  8u;
498       block1[0] = md5apr1_magic1 >> 24u;
499       break;
500
501     case 10:
502       block0[2] = block0[2]             | md5apr1_magic0 << 16u;
503       block0[3] = md5apr1_magic0 >> 16u | md5apr1_magic1 << 16u;
504       block1[0] = md5apr1_magic1 >> 16u;
505       break;
506
507     case 11:
508       block0[2] = block0[2]             | md5apr1_magic0 << 24u;
509       block0[3] = md5apr1_magic0 >>  8u | md5apr1_magic1 << 24u;
510       block1[0] = md5apr1_magic1 >>  8u;
511       break;
512
513     case 12:
514       block0[3] = md5apr1_magic0;
515       block1[0] = md5apr1_magic1;
516       break;
517
518     case 13:
519       block0[3] = block0[3]             | md5apr1_magic0 <<  8u;
520       block1[0] = md5apr1_magic0 >> 24u | md5apr1_magic1 <<  8u;
521       block1[1] = md5apr1_magic1 >> 24u;
522       break;
523
524     case 14:
525       block0[3] = block0[3]             | md5apr1_magic0 << 16u;
526       block1[0] = md5apr1_magic0 >> 16u | md5apr1_magic1 << 16u;
527       block1[1] = md5apr1_magic1 >> 16u;
528       break;
529
530     case 15:
531       block0[3] = block0[3]             | md5apr1_magic0 << 24u;
532       block1[0] = md5apr1_magic0 >>  8u | md5apr1_magic1 << 24u;
533       block1[1] = md5apr1_magic1 >>  8u;
534       break;
535   }
536 }
537
538 void append_1st (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append)
539 {
540   switch (block_len)
541   {
542     case 0:
543       block0[0] = append;
544       break;
545
546     case 1:
547       block0[0] = block0[0] | append <<  8;
548       break;
549
550     case 2:
551       block0[0] = block0[0] | append << 16;
552       break;
553
554     case 3:
555       block0[0] = block0[0] | append << 24;
556       break;
557
558     case 4:
559       block0[1] = append;
560       break;
561
562     case 5:
563       block0[1] = block0[1] | append <<  8;
564       break;
565
566     case 6:
567       block0[1] = block0[1] | append << 16;
568       break;
569
570     case 7:
571       block0[1] = block0[1] | append << 24;
572       break;
573
574     case 8:
575       block0[2] = append;
576       break;
577
578     case 9:
579       block0[2] = block0[2] | append <<  8;
580       break;
581
582     case 10:
583       block0[2] = block0[2] | append << 16;
584       break;
585
586     case 11:
587       block0[2] = block0[2] | append << 24;
588       break;
589
590     case 12:
591       block0[3] = append;
592       break;
593
594     case 13:
595       block0[3] = block0[3] | append <<  8;
596       break;
597
598     case 14:
599       block0[3] = block0[3] | append << 16;
600       break;
601
602     case 15:
603       block0[3] = block0[3] | append << 24;
604       break;
605
606     case 16:
607       block1[0] = append;
608       break;
609
610     case 17:
611       block1[0] = block1[0] | append <<  8;
612       break;
613
614     case 18:
615       block1[0] = block1[0] | append << 16;
616       break;
617
618     case 19:
619       block1[0] = block1[0] | append << 24;
620       break;
621
622     case 20:
623       block1[1] = append;
624       break;
625
626     case 21:
627       block1[1] = block1[1] | append <<  8;
628       break;
629
630     case 22:
631       block1[1] = block1[1] | append << 16;
632       break;
633
634     case 23:
635       block1[1] = block1[1] | append << 24;
636       break;
637
638     case 24:
639       block1[2] = append;
640       break;
641
642     case 25:
643       block1[2] = block1[2] | append <<  8;
644       break;
645
646     case 26:
647       block1[2] = block1[2] | append << 16;
648       break;
649
650     case 27:
651       block1[2] = block1[2] | append << 24;
652       break;
653
654     case 28:
655       block1[3] = append;
656       break;
657
658     case 29:
659       block1[3] = block1[3] | append <<  8;
660       break;
661
662     case 30:
663       block1[3] = block1[3] | append << 16;
664       break;
665
666     case 31:
667       block1[3] = block1[3] | append << 24;
668       break;
669
670     case 32:
671       block2[0] = append;
672       break;
673
674     case 33:
675       block2[0] = block2[0] | append <<  8;
676       break;
677
678     case 34:
679       block2[0] = block2[0] | append << 16;
680       break;
681
682     case 35:
683       block2[0] = block2[0] | append << 24;
684       break;
685
686     case 36:
687       block2[1] = append;
688       break;
689
690     case 37:
691       block2[1] = block2[1] | append <<  8;
692       break;
693
694     case 38:
695       block2[1] = block2[1] | append << 16;
696       break;
697
698     case 39:
699       block2[1] = block2[1] | append << 24;
700       break;
701
702     case 40:
703       block2[2] = append;
704       break;
705
706     case 41:
707       block2[2] = block2[2] | append <<  8;
708       break;
709
710     case 42:
711       block2[2] = block2[2] | append << 16;
712       break;
713
714     case 43:
715       block2[2] = block2[2] | append << 24;
716       break;
717
718     case 44:
719       block2[3] = append;
720       break;
721
722     case 45:
723       block2[3] = block2[3] | append <<  8;
724       break;
725
726     case 46:
727       block2[3] = block2[3] | append << 16;
728       break;
729
730     case 47:
731       block2[3] = block2[3] | append << 24;
732       break;
733
734     case 48:
735       block3[0] = append;
736       break;
737
738     case 49:
739       block3[0] = block3[0] | append <<  8;
740       break;
741
742     case 50:
743       block3[0] = block3[0] | append << 16;
744       break;
745
746     case 51:
747       block3[0] = block3[0] | append << 24;
748       break;
749
750     case 52:
751       block3[1] = append;
752       break;
753
754     case 53:
755       block3[1] = block3[1] | append <<  8;
756       break;
757
758     case 54:
759       block3[1] = block3[1] | append << 16;
760       break;
761
762     case 55:
763       block3[1] = block3[1] | append << 24;
764       break;
765
766     case 56:
767       block3[2] = append;
768       break;
769   }
770 }
771
772 __kernel void m01600_init (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
773 {
774   /**
775    * base
776    */
777
778   const u32 gid = get_global_id (0);
779
780   if (gid >= gid_max) return;
781
782   u32 w0[4];
783
784   w0[0] = pws[gid].i[0];
785   w0[1] = pws[gid].i[1];
786   w0[2] = pws[gid].i[2];
787   w0[3] = pws[gid].i[3];
788
789   const u32 pw_len = pws[gid].pw_len;
790
791   /**
792    * salt
793    */
794
795   u32 salt_buf[2];
796
797   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
798   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
799
800   const u32 salt_len = salt_bufs[salt_pos].salt_len;
801
802   /**
803    * init
804    */
805
806   //memcat16 (block0, block1, block2, block3, block_len, w0);
807   //block_len += pw_len;
808
809   u32 block_len = pw_len;
810
811   u32 block0[4];
812
813   block0[0] = w0[0];
814   block0[1] = w0[1];
815   block0[2] = w0[2];
816   block0[3] = w0[3];
817
818   u32 block1[4];
819
820   block1[0] = 0;
821   block1[1] = 0;
822   block1[2] = 0;
823   block1[3] = 0;
824
825   u32 block2[4];
826
827   block2[0] = 0;
828   block2[1] = 0;
829   block2[2] = 0;
830   block2[3] = 0;
831
832   u32 block3[4];
833
834   block3[0] = 0;
835   block3[1] = 0;
836   block3[2] = 0;
837   block3[3] = 0;
838
839   memcat8 (block0, block1, block2, block3, block_len, salt_buf);
840
841   block_len += salt_len;
842
843   memcat16 (block0, block1, block2, block3, block_len, w0);
844
845   block_len += pw_len;
846
847   append_0x80_4x4 (block0, block1, block2, block3, block_len);
848
849   block3[2] = block_len * 8;
850
851   u32 digest[4];
852
853   digest[0] = MD5M_A;
854   digest[1] = MD5M_B;
855   digest[2] = MD5M_C;
856   digest[3] = MD5M_D;
857
858   md5_transform (block0, block1, block2, block3, digest);
859
860   /* The password first, since that is what is most unknown */
861   /* Then our magic string */
862   /* Then the raw salt */
863   /* Then just as many characters of the MD5(pw,salt,pw) */
864
865   //memcat16 (block0, block1, block2, block3, block_len, w);
866   //block_len += pw_len;
867
868   block_len = pw_len;
869
870   block0[0] = w0[0];
871   block0[1] = w0[1];
872   block0[2] = w0[2];
873   block0[3] = w0[3];
874
875   block1[0] = 0;
876   block1[1] = 0;
877   block1[2] = 0;
878   block1[3] = 0;
879
880   block2[0] = 0;
881   block2[1] = 0;
882   block2[2] = 0;
883   block2[3] = 0;
884
885   block3[0] = 0;
886   block3[1] = 0;
887   block3[2] = 0;
888   block3[3] = 0;
889
890   append_sign (block0, block1, block_len);
891
892   block_len += 6;
893
894   memcat8 (block0, block1, block2, block3, block_len, salt_buf);
895
896   block_len += salt_len;
897
898   truncate_block (digest, pw_len);
899
900   memcat16 (block0, block1, block2, block3, block_len, digest);
901
902   block_len += pw_len;
903
904   /* Then something really weird... */
905
906   u32 append = block0[0] & 0xFF;
907
908   for (u32 j = pw_len; j; j >>= 1)
909   {
910     if ((j & 1) == 0)
911     {
912       append_1st (block0, block1, block2, block3, block_len, append);
913     }
914
915     block_len++;
916   }
917
918   append_0x80_4x4 (block0, block1, block2, block3, block_len);
919
920   block3[2] = block_len * 8;
921
922   digest[0] = MD5M_A;
923   digest[1] = MD5M_B;
924   digest[2] = MD5M_C;
925   digest[3] = MD5M_D;
926
927   md5_transform (block0, block1, block2, block3, digest);
928
929   tmps[gid].digest_buf[0] = digest[0];
930   tmps[gid].digest_buf[1] = digest[1];
931   tmps[gid].digest_buf[2] = digest[2];
932   tmps[gid].digest_buf[3] = digest[3];
933 }
934
935 __kernel void m01600_loop (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
936 {
937   /**
938    * base
939    */
940
941   const u32 gid = get_global_id (0);
942
943   if (gid >= gid_max) return;
944
945   u32 w0[4];
946
947   w0[0] = pws[gid].i[0];
948   w0[1] = pws[gid].i[1];
949   w0[2] = pws[gid].i[2];
950   w0[3] = pws[gid].i[3];
951
952   const u32 pw_len = pws[gid].pw_len;
953
954   u32 w0_x80[4];
955
956   w0_x80[0] = w0[0];
957   w0_x80[1] = w0[1];
958   w0_x80[2] = w0[2];
959   w0_x80[3] = w0[3];
960
961   append_0x80_1x4 (w0_x80, pw_len);
962
963   /**
964    * salt
965    */
966
967   u32 salt_buf[2];
968
969   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
970   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
971
972   const u32 salt_len = salt_bufs[salt_pos].salt_len;
973
974   /**
975    * digest
976    */
977
978   u32 digest[4];
979
980   digest[0] = tmps[gid].digest_buf[0];
981   digest[1] = tmps[gid].digest_buf[1];
982   digest[2] = tmps[gid].digest_buf[2];
983   digest[3] = tmps[gid].digest_buf[3];
984
985   /**
986    * loop
987    */
988
989   /* and now, just to make sure things don't run too fast */
990
991   u32 block_len;
992
993   u32 block0[4];
994
995   block0[0] = 0;
996   block0[1] = 0;
997   block0[2] = 0;
998   block0[3] = 0;
999
1000   u32 block1[4];
1001
1002   block1[0] = 0;
1003   block1[1] = 0;
1004   block1[2] = 0;
1005   block1[3] = 0;
1006
1007   u32 block2[4];
1008
1009   block2[0] = 0;
1010   block2[1] = 0;
1011   block2[2] = 0;
1012   block2[3] = 0;
1013
1014   u32 block3[4];
1015
1016   block3[0] = 0;
1017   block3[1] = 0;
1018   block3[2] = 0;
1019   block3[3] = 0;
1020
1021   for (u32 i = 0, j = loop_pos; i < loop_cnt; i++, j++)
1022   {
1023     block1[0] = 0;
1024     block1[1] = 0;
1025     block1[2] = 0;
1026     block1[3] = 0;
1027     block2[0] = 0;
1028     block2[1] = 0;
1029     block2[2] = 0;
1030     block2[3] = 0;
1031     block3[0] = 0;
1032     block3[1] = 0;
1033
1034     const u32 j1 = (j & 1) ? 1 : 0;
1035     const u32 j3 = (j % 3) ? 1 : 0;
1036     const u32 j7 = (j % 7) ? 1 : 0;
1037
1038     if (j1)
1039     {
1040       block0[0] = w0[0];
1041       block0[1] = w0[1];
1042       block0[2] = w0[2];
1043       block0[3] = w0[3];
1044
1045       block_len = pw_len;
1046
1047       if (j3)
1048       {
1049         memcat8 (block0, block1, block2, block3, block_len, salt_buf);
1050
1051         block_len += salt_len;
1052       }
1053
1054       if (j7)
1055       {
1056         memcat16 (block0, block1, block2, block3, block_len, w0);
1057
1058         block_len += pw_len;
1059       }
1060
1061       memcat16_x80 (block0, block1, block2, block3, block_len, digest);
1062
1063       block_len += 16;
1064     }
1065     else
1066     {
1067       block0[0] = digest[0];
1068       block0[1] = digest[1];
1069       block0[2] = digest[2];
1070       block0[3] = digest[3];
1071
1072       block_len = 16;
1073
1074       if (j3 && j7)
1075       {
1076         block1[0] = salt_buf[0];
1077         block1[1] = salt_buf[1];
1078
1079         block_len += salt_len;
1080
1081         memcat16 (block0, block1, block2, block3, block_len, w0);
1082
1083         block_len += pw_len;
1084       }
1085       else if (j3)
1086       {
1087         block1[0] = salt_buf[0];
1088         block1[1] = salt_buf[1];
1089
1090         block_len += salt_len;
1091       }
1092       else if (j7)
1093       {
1094         block1[0] = w0[0];
1095         block1[1] = w0[1];
1096         block1[2] = w0[2];
1097         block1[3] = w0[3];
1098
1099         block_len += pw_len;
1100       }
1101
1102       memcat16 (block0, block1, block2, block3, block_len, w0_x80);
1103
1104       block_len += pw_len;
1105     }
1106
1107     block3[2] = block_len * 8;
1108
1109     digest[0] = MD5M_A;
1110     digest[1] = MD5M_B;
1111     digest[2] = MD5M_C;
1112     digest[3] = MD5M_D;
1113
1114     md5_transform (block0, block1, block2, block3, digest);
1115   }
1116
1117   tmps[gid].digest_buf[0] = digest[0];
1118   tmps[gid].digest_buf[1] = digest[1];
1119   tmps[gid].digest_buf[2] = digest[2];
1120   tmps[gid].digest_buf[3] = digest[3];
1121 }
1122
1123 __kernel void m01600_comp (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
1124 {
1125   /**
1126    * modifier
1127    */
1128
1129   const u32 gid = get_global_id (0);
1130
1131   if (gid >= gid_max) return;
1132
1133   const u32 lid = get_local_id (0);
1134
1135   /**
1136    * digest
1137    */
1138
1139   const u32 r0 = tmps[gid].digest_buf[DGST_R0];
1140   const u32 r1 = tmps[gid].digest_buf[DGST_R1];
1141   const u32 r2 = tmps[gid].digest_buf[DGST_R2];
1142   const u32 r3 = tmps[gid].digest_buf[DGST_R3];
1143
1144   #define il_pos 0
1145
1146   #include COMPARE_M
1147 }