cfdba3b871c59fc3170d2a3160f631eef66860d7
[hashcat.git] / OpenCL / m06300.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #include "inc_hash_constants.h"
9 #include "inc_vendor.cl"
10
11 #define DGST_R0 0
12 #define DGST_R1 1
13 #define DGST_R2 2
14 #define DGST_R3 3
15
16 #include "inc_hash_functions.cl"
17 #include "inc_types.cl"
18 #include "inc_common.cl"
19
20 #define COMPARE_S "inc_comp_single.cl"
21 #define COMPARE_M "inc_comp_multi.cl"
22
23 void md5_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
24 {
25   u32 a = digest[0];
26   u32 b = digest[1];
27   u32 c = digest[2];
28   u32 d = digest[3];
29
30   u32 w0_t = w0[0];
31   u32 w1_t = w0[1];
32   u32 w2_t = w0[2];
33   u32 w3_t = w0[3];
34   u32 w4_t = w1[0];
35   u32 w5_t = w1[1];
36   u32 w6_t = w1[2];
37   u32 w7_t = w1[3];
38   u32 w8_t = w2[0];
39   u32 w9_t = w2[1];
40   u32 wa_t = w2[2];
41   u32 wb_t = w2[3];
42   u32 wc_t = w3[0];
43   u32 wd_t = w3[1];
44   u32 we_t = w3[2];
45   u32 wf_t = 0;
46
47   MD5_STEP (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
48   MD5_STEP (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
49   MD5_STEP (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
50   MD5_STEP (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
51   MD5_STEP (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
52   MD5_STEP (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
53   MD5_STEP (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
54   MD5_STEP (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
55   MD5_STEP (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
56   MD5_STEP (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
57   MD5_STEP (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
58   MD5_STEP (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
59   MD5_STEP (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
60   MD5_STEP (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
61   MD5_STEP (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
62   MD5_STEP (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
63
64   MD5_STEP (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
65   MD5_STEP (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
66   MD5_STEP (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
67   MD5_STEP (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
68   MD5_STEP (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
69   MD5_STEP (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
70   MD5_STEP (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
71   MD5_STEP (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
72   MD5_STEP (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
73   MD5_STEP (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
74   MD5_STEP (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
75   MD5_STEP (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
76   MD5_STEP (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
77   MD5_STEP (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
78   MD5_STEP (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
79   MD5_STEP (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
80
81   MD5_STEP (MD5_H , a, b, c, d, w5_t, MD5C20, MD5S20);
82   MD5_STEP (MD5_H , d, a, b, c, w8_t, MD5C21, MD5S21);
83   MD5_STEP (MD5_H , c, d, a, b, wb_t, MD5C22, MD5S22);
84   MD5_STEP (MD5_H , b, c, d, a, we_t, MD5C23, MD5S23);
85   MD5_STEP (MD5_H , a, b, c, d, w1_t, MD5C24, MD5S20);
86   MD5_STEP (MD5_H , d, a, b, c, w4_t, MD5C25, MD5S21);
87   MD5_STEP (MD5_H , c, d, a, b, w7_t, MD5C26, MD5S22);
88   MD5_STEP (MD5_H , b, c, d, a, wa_t, MD5C27, MD5S23);
89   MD5_STEP (MD5_H , a, b, c, d, wd_t, MD5C28, MD5S20);
90   MD5_STEP (MD5_H , d, a, b, c, w0_t, MD5C29, MD5S21);
91   MD5_STEP (MD5_H , c, d, a, b, w3_t, MD5C2a, MD5S22);
92   MD5_STEP (MD5_H , b, c, d, a, w6_t, MD5C2b, MD5S23);
93   MD5_STEP (MD5_H , a, b, c, d, w9_t, MD5C2c, MD5S20);
94   MD5_STEP (MD5_H , d, a, b, c, wc_t, MD5C2d, MD5S21);
95   MD5_STEP (MD5_H , c, d, a, b, wf_t, MD5C2e, MD5S22);
96   MD5_STEP (MD5_H , b, c, d, a, w2_t, MD5C2f, MD5S23);
97
98   MD5_STEP (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
99   MD5_STEP (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
100   MD5_STEP (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
101   MD5_STEP (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
102   MD5_STEP (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
103   MD5_STEP (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
104   MD5_STEP (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
105   MD5_STEP (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
106   MD5_STEP (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
107   MD5_STEP (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
108   MD5_STEP (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
109   MD5_STEP (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
110   MD5_STEP (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
111   MD5_STEP (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
112   MD5_STEP (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
113   MD5_STEP (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
114
115   digest[0] += a;
116   digest[1] += b;
117   digest[2] += c;
118   digest[3] += d;
119 }
120
121 void memcat16 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[4])
122 {
123   u32 tmp0;
124   u32 tmp1;
125   u32 tmp2;
126   u32 tmp3;
127   u32 tmp4;
128
129   #if defined IS_AMD || defined IS_GENERIC
130
131   const int offset_minus_4 = 4 - (block_len & 3);
132
133   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
134   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
135   tmp2 = amd_bytealign (append[2], append[1], offset_minus_4);
136   tmp3 = amd_bytealign (append[3], append[2], offset_minus_4);
137   tmp4 = amd_bytealign (        0, append[3], offset_minus_4);
138
139   const u32 mod = block_len & 3;
140
141   if (mod == 0)
142   {
143     tmp0 = tmp1;
144     tmp1 = tmp2;
145     tmp2 = tmp3;
146     tmp3 = tmp4;
147     tmp4 = 0;
148   }
149
150   #endif
151
152   #ifdef IS_NV
153
154   const int offset_minus_4 = 4 - (block_len & 3);
155
156   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
157
158   tmp0 = __byte_perm (        0, append[0], selector);
159   tmp1 = __byte_perm (append[0], append[1], selector);
160   tmp2 = __byte_perm (append[1], append[2], selector);
161   tmp3 = __byte_perm (append[2], append[3], selector);
162   tmp4 = __byte_perm (append[3],         0, selector);
163
164   #endif
165
166   const u32 div = block_len / 4;
167
168   switch (div)
169   {
170     case  0:  block0[0] |= tmp0;
171               block0[1]  = tmp1;
172               block0[2]  = tmp2;
173               block0[3]  = tmp3;
174               block1[0]  = tmp4;
175               break;
176     case  1:  block0[1] |= tmp0;
177               block0[2]  = tmp1;
178               block0[3]  = tmp2;
179               block1[0]  = tmp3;
180               block1[1]  = tmp4;
181               break;
182     case  2:  block0[2] |= tmp0;
183               block0[3]  = tmp1;
184               block1[0]  = tmp2;
185               block1[1]  = tmp3;
186               block1[2]  = tmp4;
187               break;
188     case  3:  block0[3] |= tmp0;
189               block1[0]  = tmp1;
190               block1[1]  = tmp2;
191               block1[2]  = tmp3;
192               block1[3]  = tmp4;
193               break;
194     case  4:  block1[0] |= tmp0;
195               block1[1]  = tmp1;
196               block1[2]  = tmp2;
197               block1[3]  = tmp3;
198               block2[0]  = tmp4;
199               break;
200     case  5:  block1[1] |= tmp0;
201               block1[2]  = tmp1;
202               block1[3]  = tmp2;
203               block2[0]  = tmp3;
204               block2[1]  = tmp4;
205               break;
206     case  6:  block1[2] |= tmp0;
207               block1[3]  = tmp1;
208               block2[0]  = tmp2;
209               block2[1]  = tmp3;
210               block2[2]  = tmp4;
211               break;
212     case  7:  block1[3] |= tmp0;
213               block2[0]  = tmp1;
214               block2[1]  = tmp2;
215               block2[2]  = tmp3;
216               block2[3]  = tmp4;
217               break;
218     case  8:  block2[0] |= tmp0;
219               block2[1]  = tmp1;
220               block2[2]  = tmp2;
221               block2[3]  = tmp3;
222               block3[0]  = tmp4;
223               break;
224     case  9:  block2[1] |= tmp0;
225               block2[2]  = tmp1;
226               block2[3]  = tmp2;
227               block3[0]  = tmp3;
228               block3[1]  = tmp4;
229               break;
230   }
231 }
232
233 void memcat16_x80 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[4])
234 {
235   u32 tmp0;
236   u32 tmp1;
237   u32 tmp2;
238   u32 tmp3;
239   u32 tmp4;
240
241   #if defined IS_AMD || defined IS_GENERIC
242
243   const int offset_minus_4 = 4 - (block_len & 3);
244
245   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
246   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
247   tmp2 = amd_bytealign (append[2], append[1], offset_minus_4);
248   tmp3 = amd_bytealign (append[3], append[2], offset_minus_4);
249   tmp4 = amd_bytealign (     0x80, append[3], offset_minus_4);
250
251   const u32 mod = block_len & 3;
252
253   if (mod == 0)
254   {
255     tmp0 = tmp1;
256     tmp1 = tmp2;
257     tmp2 = tmp3;
258     tmp3 = tmp4;
259     tmp4 = 0x80;
260   }
261
262   #endif
263
264   #ifdef IS_NV
265
266   const int offset_minus_4 = 4 - (block_len & 3);
267
268   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
269
270   tmp0 = __byte_perm (        0, append[0], selector);
271   tmp1 = __byte_perm (append[0], append[1], selector);
272   tmp2 = __byte_perm (append[1], append[2], selector);
273   tmp3 = __byte_perm (append[2], append[3], selector);
274   tmp4 = __byte_perm (append[3],      0x80, selector);
275
276   #endif
277
278   const u32 div = block_len / 4;
279
280   switch (div)
281   {
282     case  0:  block0[0] |= tmp0;
283               block0[1]  = tmp1;
284               block0[2]  = tmp2;
285               block0[3]  = tmp3;
286               block1[0]  = tmp4;
287               break;
288     case  1:  block0[1] |= tmp0;
289               block0[2]  = tmp1;
290               block0[3]  = tmp2;
291               block1[0]  = tmp3;
292               block1[1]  = tmp4;
293               break;
294     case  2:  block0[2] |= tmp0;
295               block0[3]  = tmp1;
296               block1[0]  = tmp2;
297               block1[1]  = tmp3;
298               block1[2]  = tmp4;
299               break;
300     case  3:  block0[3] |= tmp0;
301               block1[0]  = tmp1;
302               block1[1]  = tmp2;
303               block1[2]  = tmp3;
304               block1[3]  = tmp4;
305               break;
306     case  4:  block1[0] |= tmp0;
307               block1[1]  = tmp1;
308               block1[2]  = tmp2;
309               block1[3]  = tmp3;
310               block2[0]  = tmp4;
311               break;
312     case  5:  block1[1] |= tmp0;
313               block1[2]  = tmp1;
314               block1[3]  = tmp2;
315               block2[0]  = tmp3;
316               block2[1]  = tmp4;
317               break;
318     case  6:  block1[2] |= tmp0;
319               block1[3]  = tmp1;
320               block2[0]  = tmp2;
321               block2[1]  = tmp3;
322               block2[2]  = tmp4;
323               break;
324     case  7:  block1[3] |= tmp0;
325               block2[0]  = tmp1;
326               block2[1]  = tmp2;
327               block2[2]  = tmp3;
328               block2[3]  = tmp4;
329               break;
330     case  8:  block2[0] |= tmp0;
331               block2[1]  = tmp1;
332               block2[2]  = tmp2;
333               block2[3]  = tmp3;
334               block3[0]  = tmp4;
335               break;
336     case  9:  block2[1] |= tmp0;
337               block2[2]  = tmp1;
338               block2[3]  = tmp2;
339               block3[0]  = tmp3;
340               block3[1]  = tmp4;
341               break;
342   }
343 }
344
345 void memcat8 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[2])
346 {
347   u32 tmp0;
348   u32 tmp1;
349   u32 tmp2;
350
351   #if defined IS_AMD || defined IS_GENERIC
352
353   const int offset_minus_4 = 4 - (block_len & 3);
354
355   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
356   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
357   tmp2 = amd_bytealign (        0, append[1], offset_minus_4);
358
359   const u32 mod = block_len & 3;
360
361   if (mod == 0)
362   {
363     tmp0 = tmp1;
364     tmp1 = tmp2;
365     tmp2 = 0;
366   }
367
368   #endif
369
370   #ifdef IS_NV
371
372   const int offset_minus_4 = 4 - (block_len & 3);
373
374   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
375
376   tmp0 = __byte_perm (        0, append[0], selector);
377   tmp1 = __byte_perm (append[0], append[1], selector);
378   tmp2 = __byte_perm (append[1],         0, selector);
379
380   #endif
381
382   const u32 div = block_len / 4;
383
384   switch (div)
385   {
386     case  0:  block0[0] |= tmp0;
387               block0[1]  = tmp1;
388               block0[2]  = tmp2;
389               break;
390     case  1:  block0[1] |= tmp0;
391               block0[2]  = tmp1;
392               block0[3]  = tmp2;
393               break;
394     case  2:  block0[2] |= tmp0;
395               block0[3]  = tmp1;
396               block1[0]  = tmp2;
397               break;
398     case  3:  block0[3] |= tmp0;
399               block1[0]  = tmp1;
400               block1[1]  = tmp2;
401               break;
402     case  4:  block1[0] |= tmp0;
403               block1[1]  = tmp1;
404               block1[2]  = tmp2;
405               break;
406     case  5:  block1[1] |= tmp0;
407               block1[2]  = tmp1;
408               block1[3]  = tmp2;
409               break;
410     case  6:  block1[2] |= tmp0;
411               block1[3]  = tmp1;
412               block2[0]  = tmp2;
413               break;
414     case  7:  block1[3] |= tmp0;
415               block2[0]  = tmp1;
416               block2[1]  = tmp2;
417               break;
418     case  8:  block2[0] |= tmp0;
419               block2[1]  = tmp1;
420               block2[2]  = tmp2;
421               break;
422     case  9:  block2[1] |= tmp0;
423               block2[2]  = tmp1;
424               block2[3]  = tmp2;
425               break;
426     case 10:  block2[2] |= tmp0;
427               block2[3]  = tmp1;
428               block3[0]  = tmp2;
429               break;
430     case 11:  block2[3] |= tmp0;
431               block3[0]  = tmp1;
432               block3[1]  = tmp2;
433               break;
434   }
435 }
436
437 void append_1st (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append)
438 {
439   switch (block_len)
440   {
441     case 0:
442       block0[0] = append;
443       break;
444
445     case 1:
446       block0[0] = block0[0] | append <<  8;
447       break;
448
449     case 2:
450       block0[0] = block0[0] | append << 16;
451       break;
452
453     case 3:
454       block0[0] = block0[0] | append << 24;
455       break;
456
457     case 4:
458       block0[1] = append;
459       break;
460
461     case 5:
462       block0[1] = block0[1] | append <<  8;
463       break;
464
465     case 6:
466       block0[1] = block0[1] | append << 16;
467       break;
468
469     case 7:
470       block0[1] = block0[1] | append << 24;
471       break;
472
473     case 8:
474       block0[2] = append;
475       break;
476
477     case 9:
478       block0[2] = block0[2] | append <<  8;
479       break;
480
481     case 10:
482       block0[2] = block0[2] | append << 16;
483       break;
484
485     case 11:
486       block0[2] = block0[2] | append << 24;
487       break;
488
489     case 12:
490       block0[3] = append;
491       break;
492
493     case 13:
494       block0[3] = block0[3] | append <<  8;
495       break;
496
497     case 14:
498       block0[3] = block0[3] | append << 16;
499       break;
500
501     case 15:
502       block0[3] = block0[3] | append << 24;
503       break;
504
505     case 16:
506       block1[0] = append;
507       break;
508
509     case 17:
510       block1[0] = block1[0] | append <<  8;
511       break;
512
513     case 18:
514       block1[0] = block1[0] | append << 16;
515       break;
516
517     case 19:
518       block1[0] = block1[0] | append << 24;
519       break;
520
521     case 20:
522       block1[1] = append;
523       break;
524
525     case 21:
526       block1[1] = block1[1] | append <<  8;
527       break;
528
529     case 22:
530       block1[1] = block1[1] | append << 16;
531       break;
532
533     case 23:
534       block1[1] = block1[1] | append << 24;
535       break;
536
537     case 24:
538       block1[2] = append;
539       break;
540
541     case 25:
542       block1[2] = block1[2] | append <<  8;
543       break;
544
545     case 26:
546       block1[2] = block1[2] | append << 16;
547       break;
548
549     case 27:
550       block1[2] = block1[2] | append << 24;
551       break;
552
553     case 28:
554       block1[3] = append;
555       break;
556
557     case 29:
558       block1[3] = block1[3] | append <<  8;
559       break;
560
561     case 30:
562       block1[3] = block1[3] | append << 16;
563       break;
564
565     case 31:
566       block1[3] = block1[3] | append << 24;
567       break;
568
569     case 32:
570       block2[0] = append;
571       break;
572
573     case 33:
574       block2[0] = block2[0] | append <<  8;
575       break;
576
577     case 34:
578       block2[0] = block2[0] | append << 16;
579       break;
580
581     case 35:
582       block2[0] = block2[0] | append << 24;
583       break;
584
585     case 36:
586       block2[1] = append;
587       break;
588
589     case 37:
590       block2[1] = block2[1] | append <<  8;
591       break;
592
593     case 38:
594       block2[1] = block2[1] | append << 16;
595       break;
596
597     case 39:
598       block2[1] = block2[1] | append << 24;
599       break;
600
601     case 40:
602       block2[2] = append;
603       break;
604
605     case 41:
606       block2[2] = block2[2] | append <<  8;
607       break;
608
609     case 42:
610       block2[2] = block2[2] | append << 16;
611       break;
612
613     case 43:
614       block2[2] = block2[2] | append << 24;
615       break;
616
617     case 44:
618       block2[3] = append;
619       break;
620
621     case 45:
622       block2[3] = block2[3] | append <<  8;
623       break;
624
625     case 46:
626       block2[3] = block2[3] | append << 16;
627       break;
628
629     case 47:
630       block2[3] = block2[3] | append << 24;
631       break;
632
633     case 48:
634       block3[0] = append;
635       break;
636
637     case 49:
638       block3[0] = block3[0] | append <<  8;
639       break;
640
641     case 50:
642       block3[0] = block3[0] | append << 16;
643       break;
644
645     case 51:
646       block3[0] = block3[0] | append << 24;
647       break;
648
649     case 52:
650       block3[1] = append;
651       break;
652
653     case 53:
654       block3[1] = block3[1] | append <<  8;
655       break;
656
657     case 54:
658       block3[1] = block3[1] | append << 16;
659       break;
660
661     case 55:
662       block3[1] = block3[1] | append << 24;
663       break;
664
665     case 56:
666       block3[2] = append;
667       break;
668   }
669 }
670
671 __kernel void m06300_init (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
672 {
673   /**
674    * base
675    */
676
677   const u32 gid = get_global_id (0);
678
679   if (gid >= gid_max) return;
680
681   u32 w0[4];
682
683   w0[0] = pws[gid].i[0];
684   w0[1] = pws[gid].i[1];
685   w0[2] = pws[gid].i[2];
686   w0[3] = pws[gid].i[3];
687
688   const u32 pw_len = pws[gid].pw_len;
689
690   /**
691    * salt
692    */
693
694   u32 salt_buf[2];
695
696   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
697   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
698
699   const u32 salt_len = salt_bufs[salt_pos].salt_len;
700
701   /**
702    * init
703    */
704
705   //memcat16 (block0, block1, block2, block3, block_len, w0);
706   //block_len += pw_len;
707
708   u32 block_len = pw_len;
709
710   u32 block0[4];
711
712   block0[0] = w0[0];
713   block0[1] = w0[1];
714   block0[2] = w0[2];
715   block0[3] = w0[3];
716
717   u32 block1[4];
718
719   block1[0] = 0;
720   block1[1] = 0;
721   block1[2] = 0;
722   block1[3] = 0;
723
724   u32 block2[4];
725
726   block2[0] = 0;
727   block2[1] = 0;
728   block2[2] = 0;
729   block2[3] = 0;
730
731   u32 block3[4];
732
733   block3[0] = 0;
734   block3[1] = 0;
735   block3[2] = 0;
736   block3[3] = 0;
737
738   memcat8 (block0, block1, block2, block3, block_len, salt_buf);
739
740   block_len += salt_len;
741
742   memcat16 (block0, block1, block2, block3, block_len, w0);
743
744   block_len += pw_len;
745
746   append_0x80_4x4 (block0, block1, block2, block3, block_len);
747
748   block3[2] = block_len * 8;
749
750   u32 digest[4];
751
752   digest[0] = MD5M_A;
753   digest[1] = MD5M_B;
754   digest[2] = MD5M_C;
755   digest[3] = MD5M_D;
756
757   md5_transform (block0, block1, block2, block3, digest);
758
759   /* The password first, since that is what is most unknown */
760   /* Then the raw salt */
761   /* Then just as many characters of the MD5(pw,salt,pw) */
762
763   //memcat16 (block0, block1, block2, block3, block_len, w);
764   //block_len += pw_len;
765
766   block_len = pw_len;
767
768   block0[0] = w0[0];
769   block0[1] = w0[1];
770   block0[2] = w0[2];
771   block0[3] = w0[3];
772
773   block1[0] = 0;
774   block1[1] = 0;
775   block1[2] = 0;
776   block1[3] = 0;
777
778   block2[0] = 0;
779   block2[1] = 0;
780   block2[2] = 0;
781   block2[3] = 0;
782
783   block3[0] = 0;
784   block3[1] = 0;
785   block3[2] = 0;
786   block3[3] = 0;
787
788   memcat8 (block0, block1, block2, block3, block_len, salt_buf);
789
790   block_len += salt_len;
791
792   truncate_block (digest, pw_len);
793
794   memcat16 (block0, block1, block2, block3, block_len, digest);
795
796   block_len += pw_len;
797
798   /* Then something really weird... */
799
800   u32 append = block0[0] & 0xFF;
801
802   for (u32 j = pw_len; j; j >>= 1)
803   {
804     if ((j & 1) == 0)
805     {
806       append_1st (block0, block1, block2, block3, block_len, append);
807     }
808
809     block_len++;
810   }
811
812   append_0x80_4x4 (block0, block1, block2, block3, block_len);
813
814   block3[2] = block_len * 8;
815
816   digest[0] = MD5M_A;
817   digest[1] = MD5M_B;
818   digest[2] = MD5M_C;
819   digest[3] = MD5M_D;
820
821   md5_transform (block0, block1, block2, block3, digest);
822
823   tmps[gid].digest_buf[0] = digest[0];
824   tmps[gid].digest_buf[1] = digest[1];
825   tmps[gid].digest_buf[2] = digest[2];
826   tmps[gid].digest_buf[3] = digest[3];
827 }
828
829 __kernel void m06300_loop (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
830 {
831   /**
832    * base
833    */
834
835   const u32 gid = get_global_id (0);
836
837   if (gid >= gid_max) return;
838
839   u32 w0[4];
840
841   w0[0] = pws[gid].i[0];
842   w0[1] = pws[gid].i[1];
843   w0[2] = pws[gid].i[2];
844   w0[3] = pws[gid].i[3];
845
846   const u32 pw_len = pws[gid].pw_len;
847
848   u32 w0_x80[4];
849
850   w0_x80[0] = w0[0];
851   w0_x80[1] = w0[1];
852   w0_x80[2] = w0[2];
853   w0_x80[3] = w0[3];
854
855   append_0x80_1x4 (w0_x80, pw_len);
856
857   /**
858    * salt
859    */
860
861   u32 salt_buf[2];
862
863   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
864   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
865
866   const u32 salt_len = salt_bufs[salt_pos].salt_len;
867
868   /**
869    * digest
870    */
871
872   u32 digest[4];
873
874   digest[0] = tmps[gid].digest_buf[0];
875   digest[1] = tmps[gid].digest_buf[1];
876   digest[2] = tmps[gid].digest_buf[2];
877   digest[3] = tmps[gid].digest_buf[3];
878
879   /**
880    * loop
881    */
882
883   /* and now, just to make sure things don't run too fast */
884
885   u32 block_len;
886
887   u32 block0[4];
888
889   block0[0] = 0;
890   block0[1] = 0;
891   block0[2] = 0;
892   block0[3] = 0;
893
894   u32 block1[4];
895
896   block1[0] = 0;
897   block1[1] = 0;
898   block1[2] = 0;
899   block1[3] = 0;
900
901   u32 block2[4];
902
903   block2[0] = 0;
904   block2[1] = 0;
905   block2[2] = 0;
906   block2[3] = 0;
907
908   u32 block3[4];
909
910   block3[0] = 0;
911   block3[1] = 0;
912   block3[2] = 0;
913   block3[3] = 0;
914
915   for (u32 i = 0, j = loop_pos; i < loop_cnt; i++, j++)
916   {
917     block1[0] = 0;
918     block1[1] = 0;
919     block1[2] = 0;
920     block1[3] = 0;
921     block2[0] = 0;
922     block2[1] = 0;
923     block2[2] = 0;
924     block2[3] = 0;
925     block3[0] = 0;
926     block3[1] = 0;
927
928     const u32 j1 = (j & 1) ? 1 : 0;
929     const u32 j3 = (j % 3) ? 1 : 0;
930     const u32 j7 = (j % 7) ? 1 : 0;
931
932     if (j1)
933     {
934       block0[0] = w0[0];
935       block0[1] = w0[1];
936       block0[2] = w0[2];
937       block0[3] = w0[3];
938
939       block_len = pw_len;
940
941       if (j3)
942       {
943         memcat8 (block0, block1, block2, block3, block_len, salt_buf);
944
945         block_len += salt_len;
946       }
947
948       if (j7)
949       {
950         memcat16 (block0, block1, block2, block3, block_len, w0);
951
952         block_len += pw_len;
953       }
954
955       memcat16_x80 (block0, block1, block2, block3, block_len, digest);
956
957       block_len += 16;
958     }
959     else
960     {
961       block0[0] = digest[0];
962       block0[1] = digest[1];
963       block0[2] = digest[2];
964       block0[3] = digest[3];
965
966       block_len = 16;
967
968       if (j3 && j7)
969       {
970         block1[0] = salt_buf[0];
971         block1[1] = salt_buf[1];
972
973         block_len += salt_len;
974
975         memcat16 (block0, block1, block2, block3, block_len, w0);
976
977         block_len += pw_len;
978       }
979       else if (j3)
980       {
981         block1[0] = salt_buf[0];
982         block1[1] = salt_buf[1];
983
984         block_len += salt_len;
985       }
986       else if (j7)
987       {
988         block1[0] = w0[0];
989         block1[1] = w0[1];
990         block1[2] = w0[2];
991         block1[3] = w0[3];
992
993         block_len += pw_len;
994       }
995
996       memcat16 (block0, block1, block2, block3, block_len, w0_x80);
997
998       block_len += pw_len;
999     }
1000
1001     block3[2] = block_len * 8;
1002
1003     digest[0] = MD5M_A;
1004     digest[1] = MD5M_B;
1005     digest[2] = MD5M_C;
1006     digest[3] = MD5M_D;
1007
1008     md5_transform (block0, block1, block2, block3, digest);
1009   }
1010
1011   tmps[gid].digest_buf[0] = digest[0];
1012   tmps[gid].digest_buf[1] = digest[1];
1013   tmps[gid].digest_buf[2] = digest[2];
1014   tmps[gid].digest_buf[3] = digest[3];
1015 }
1016
1017 __kernel void m06300_comp (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
1018 {
1019   /**
1020    * modifier
1021    */
1022
1023   const u32 gid = get_global_id (0);
1024
1025   if (gid >= gid_max) return;
1026
1027   const u32 lid = get_local_id (0);
1028
1029   /**
1030    * digest
1031    */
1032
1033   const u32 r0 = tmps[gid].digest_buf[DGST_R0];
1034   const u32 r1 = tmps[gid].digest_buf[DGST_R1];
1035   const u32 r2 = tmps[gid].digest_buf[DGST_R2];
1036   const u32 r3 = tmps[gid].digest_buf[DGST_R3];
1037
1038   #define il_pos 0
1039
1040   #include COMPARE_M
1041 }