More fixes for IS_UNKNOWN in kernels
[hashcat.git] / OpenCL / m06300.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #include "include/constants.h"
9 #include "include/kernel_vendor.h"
10
11 #define DGST_R0 0
12 #define DGST_R1 1
13 #define DGST_R2 2
14 #define DGST_R3 3
15
16 #include "include/kernel_functions.c"
17 #include "OpenCL/types_ocl.c"
18 #include "OpenCL/common.c"
19
20 #define COMPARE_S "OpenCL/check_single_comp4.c"
21 #define COMPARE_M "OpenCL/check_multi_comp4.c"
22
23 static void md5_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
24 {
25   u32 a = digest[0];
26   u32 b = digest[1];
27   u32 c = digest[2];
28   u32 d = digest[3];
29
30   u32 w0_t = w0[0];
31   u32 w1_t = w0[1];
32   u32 w2_t = w0[2];
33   u32 w3_t = w0[3];
34   u32 w4_t = w1[0];
35   u32 w5_t = w1[1];
36   u32 w6_t = w1[2];
37   u32 w7_t = w1[3];
38   u32 w8_t = w2[0];
39   u32 w9_t = w2[1];
40   u32 wa_t = w2[2];
41   u32 wb_t = w2[3];
42   u32 wc_t = w3[0];
43   u32 wd_t = w3[1];
44   u32 we_t = w3[2];
45   u32 wf_t = 0;
46
47   u32 tmp2;
48
49   MD5_STEP (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
50   MD5_STEP (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
51   MD5_STEP (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
52   MD5_STEP (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
53   MD5_STEP (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
54   MD5_STEP (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
55   MD5_STEP (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
56   MD5_STEP (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
57   MD5_STEP (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
58   MD5_STEP (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
59   MD5_STEP (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
60   MD5_STEP (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
61   MD5_STEP (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
62   MD5_STEP (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
63   MD5_STEP (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
64   MD5_STEP (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
65
66   MD5_STEP (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
67   MD5_STEP (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
68   MD5_STEP (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
69   MD5_STEP (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
70   MD5_STEP (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
71   MD5_STEP (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
72   MD5_STEP (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
73   MD5_STEP (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
74   MD5_STEP (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
75   MD5_STEP (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
76   MD5_STEP (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
77   MD5_STEP (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
78   MD5_STEP (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
79   MD5_STEP (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
80   MD5_STEP (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
81   MD5_STEP (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
82
83   MD5_STEP (MD5_H1, a, b, c, d, w5_t, MD5C20, MD5S20);
84   MD5_STEP (MD5_H2, d, a, b, c, w8_t, MD5C21, MD5S21);
85   MD5_STEP (MD5_H1, c, d, a, b, wb_t, MD5C22, MD5S22);
86   MD5_STEP (MD5_H2, b, c, d, a, we_t, MD5C23, MD5S23);
87   MD5_STEP (MD5_H1, a, b, c, d, w1_t, MD5C24, MD5S20);
88   MD5_STEP (MD5_H2, d, a, b, c, w4_t, MD5C25, MD5S21);
89   MD5_STEP (MD5_H1, c, d, a, b, w7_t, MD5C26, MD5S22);
90   MD5_STEP (MD5_H2, b, c, d, a, wa_t, MD5C27, MD5S23);
91   MD5_STEP (MD5_H1, a, b, c, d, wd_t, MD5C28, MD5S20);
92   MD5_STEP (MD5_H2, d, a, b, c, w0_t, MD5C29, MD5S21);
93   MD5_STEP (MD5_H1, c, d, a, b, w3_t, MD5C2a, MD5S22);
94   MD5_STEP (MD5_H2, b, c, d, a, w6_t, MD5C2b, MD5S23);
95   MD5_STEP (MD5_H1, a, b, c, d, w9_t, MD5C2c, MD5S20);
96   MD5_STEP (MD5_H2, d, a, b, c, wc_t, MD5C2d, MD5S21);
97   MD5_STEP (MD5_H1, c, d, a, b, wf_t, MD5C2e, MD5S22);
98   MD5_STEP (MD5_H2, b, c, d, a, w2_t, MD5C2f, MD5S23);
99
100   MD5_STEP (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
101   MD5_STEP (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
102   MD5_STEP (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
103   MD5_STEP (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
104   MD5_STEP (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
105   MD5_STEP (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
106   MD5_STEP (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
107   MD5_STEP (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
108   MD5_STEP (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
109   MD5_STEP (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
110   MD5_STEP (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
111   MD5_STEP (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
112   MD5_STEP (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
113   MD5_STEP (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
114   MD5_STEP (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
115   MD5_STEP (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
116
117   digest[0] += a;
118   digest[1] += b;
119   digest[2] += c;
120   digest[3] += d;
121 }
122
123 static void memcat16 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[4])
124 {
125   u32 tmp0;
126   u32 tmp1;
127   u32 tmp2;
128   u32 tmp3;
129   u32 tmp4;
130
131   #if defined IS_AMD || defined IS_UNKNOWN
132
133   const int offset_minus_4 = 4 - (block_len & 3);
134
135   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
136   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
137   tmp2 = amd_bytealign (append[2], append[1], offset_minus_4);
138   tmp3 = amd_bytealign (append[3], append[2], offset_minus_4);
139   tmp4 = amd_bytealign (        0, append[3], offset_minus_4);
140
141   const u32 mod = block_len & 3;
142
143   if (mod == 0)
144   {
145     tmp0 = tmp1;
146     tmp1 = tmp2;
147     tmp2 = tmp3;
148     tmp3 = tmp4;
149     tmp4 = 0;
150   }
151
152   #endif
153
154   #ifdef IS_NV
155
156   const int offset_minus_4 = 4 - (block_len & 3);
157
158   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
159
160   tmp0 = __byte_perm (        0, append[0], selector);
161   tmp1 = __byte_perm (append[0], append[1], selector);
162   tmp2 = __byte_perm (append[1], append[2], selector);
163   tmp3 = __byte_perm (append[2], append[3], selector);
164   tmp4 = __byte_perm (append[3],         0, selector);
165
166   #endif
167
168   const u32 div = block_len / 4;
169
170   switch (div)
171   {
172     case  0:  block0[0] |= tmp0;
173               block0[1]  = tmp1;
174               block0[2]  = tmp2;
175               block0[3]  = tmp3;
176               block1[0]  = tmp4;
177               break;
178     case  1:  block0[1] |= tmp0;
179               block0[2]  = tmp1;
180               block0[3]  = tmp2;
181               block1[0]  = tmp3;
182               block1[1]  = tmp4;
183               break;
184     case  2:  block0[2] |= tmp0;
185               block0[3]  = tmp1;
186               block1[0]  = tmp2;
187               block1[1]  = tmp3;
188               block1[2]  = tmp4;
189               break;
190     case  3:  block0[3] |= tmp0;
191               block1[0]  = tmp1;
192               block1[1]  = tmp2;
193               block1[2]  = tmp3;
194               block1[3]  = tmp4;
195               break;
196     case  4:  block1[0] |= tmp0;
197               block1[1]  = tmp1;
198               block1[2]  = tmp2;
199               block1[3]  = tmp3;
200               block2[0]  = tmp4;
201               break;
202     case  5:  block1[1] |= tmp0;
203               block1[2]  = tmp1;
204               block1[3]  = tmp2;
205               block2[0]  = tmp3;
206               block2[1]  = tmp4;
207               break;
208     case  6:  block1[2] |= tmp0;
209               block1[3]  = tmp1;
210               block2[0]  = tmp2;
211               block2[1]  = tmp3;
212               block2[2]  = tmp4;
213               break;
214     case  7:  block1[3] |= tmp0;
215               block2[0]  = tmp1;
216               block2[1]  = tmp2;
217               block2[2]  = tmp3;
218               block2[3]  = tmp4;
219               break;
220     case  8:  block2[0] |= tmp0;
221               block2[1]  = tmp1;
222               block2[2]  = tmp2;
223               block2[3]  = tmp3;
224               block3[0]  = tmp4;
225               break;
226     case  9:  block2[1] |= tmp0;
227               block2[2]  = tmp1;
228               block2[3]  = tmp2;
229               block3[0]  = tmp3;
230               block3[1]  = tmp4;
231               break;
232   }
233 }
234
235 static void memcat16_x80 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[4])
236 {
237   u32 tmp0;
238   u32 tmp1;
239   u32 tmp2;
240   u32 tmp3;
241   u32 tmp4;
242
243   #if defined IS_AMD || defined IS_UNKNOWN
244
245   const int offset_minus_4 = 4 - (block_len & 3);
246
247   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
248   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
249   tmp2 = amd_bytealign (append[2], append[1], offset_minus_4);
250   tmp3 = amd_bytealign (append[3], append[2], offset_minus_4);
251   tmp4 = amd_bytealign (     0x80, append[3], offset_minus_4);
252
253   const u32 mod = block_len & 3;
254
255   if (mod == 0)
256   {
257     tmp0 = tmp1;
258     tmp1 = tmp2;
259     tmp2 = tmp3;
260     tmp3 = tmp4;
261     tmp4 = 0x80;
262   }
263
264   #endif
265
266   #ifdef IS_NV
267
268   const int offset_minus_4 = 4 - (block_len & 3);
269
270   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
271
272   tmp0 = __byte_perm (        0, append[0], selector);
273   tmp1 = __byte_perm (append[0], append[1], selector);
274   tmp2 = __byte_perm (append[1], append[2], selector);
275   tmp3 = __byte_perm (append[2], append[3], selector);
276   tmp4 = __byte_perm (append[3],      0x80, selector);
277
278   #endif
279
280   const u32 div = block_len / 4;
281
282   switch (div)
283   {
284     case  0:  block0[0] |= tmp0;
285               block0[1]  = tmp1;
286               block0[2]  = tmp2;
287               block0[3]  = tmp3;
288               block1[0]  = tmp4;
289               break;
290     case  1:  block0[1] |= tmp0;
291               block0[2]  = tmp1;
292               block0[3]  = tmp2;
293               block1[0]  = tmp3;
294               block1[1]  = tmp4;
295               break;
296     case  2:  block0[2] |= tmp0;
297               block0[3]  = tmp1;
298               block1[0]  = tmp2;
299               block1[1]  = tmp3;
300               block1[2]  = tmp4;
301               break;
302     case  3:  block0[3] |= tmp0;
303               block1[0]  = tmp1;
304               block1[1]  = tmp2;
305               block1[2]  = tmp3;
306               block1[3]  = tmp4;
307               break;
308     case  4:  block1[0] |= tmp0;
309               block1[1]  = tmp1;
310               block1[2]  = tmp2;
311               block1[3]  = tmp3;
312               block2[0]  = tmp4;
313               break;
314     case  5:  block1[1] |= tmp0;
315               block1[2]  = tmp1;
316               block1[3]  = tmp2;
317               block2[0]  = tmp3;
318               block2[1]  = tmp4;
319               break;
320     case  6:  block1[2] |= tmp0;
321               block1[3]  = tmp1;
322               block2[0]  = tmp2;
323               block2[1]  = tmp3;
324               block2[2]  = tmp4;
325               break;
326     case  7:  block1[3] |= tmp0;
327               block2[0]  = tmp1;
328               block2[1]  = tmp2;
329               block2[2]  = tmp3;
330               block2[3]  = tmp4;
331               break;
332     case  8:  block2[0] |= tmp0;
333               block2[1]  = tmp1;
334               block2[2]  = tmp2;
335               block2[3]  = tmp3;
336               block3[0]  = tmp4;
337               break;
338     case  9:  block2[1] |= tmp0;
339               block2[2]  = tmp1;
340               block2[3]  = tmp2;
341               block3[0]  = tmp3;
342               block3[1]  = tmp4;
343               break;
344   }
345 }
346
347 static void memcat8 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[2])
348 {
349   u32 tmp0;
350   u32 tmp1;
351   u32 tmp2;
352
353   #if defined IS_AMD || defined IS_UNKNOWN
354
355   const int offset_minus_4 = 4 - (block_len & 3);
356
357   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
358   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
359   tmp2 = amd_bytealign (        0, append[1], offset_minus_4);
360
361   const u32 mod = block_len & 3;
362
363   if (mod == 0)
364   {
365     tmp0 = tmp1;
366     tmp1 = tmp2;
367     tmp2 = 0;
368   }
369
370   #endif
371
372   #ifdef IS_NV
373
374   const int offset_minus_4 = 4 - (block_len & 3);
375
376   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
377
378   tmp0 = __byte_perm (        0, append[0], selector);
379   tmp1 = __byte_perm (append[0], append[1], selector);
380   tmp2 = __byte_perm (append[1],         0, selector);
381
382   #endif
383
384   const u32 div = block_len / 4;
385
386   switch (div)
387   {
388     case  0:  block0[0] |= tmp0;
389               block0[1]  = tmp1;
390               block0[2]  = tmp2;
391               break;
392     case  1:  block0[1] |= tmp0;
393               block0[2]  = tmp1;
394               block0[3]  = tmp2;
395               break;
396     case  2:  block0[2] |= tmp0;
397               block0[3]  = tmp1;
398               block1[0]  = tmp2;
399               break;
400     case  3:  block0[3] |= tmp0;
401               block1[0]  = tmp1;
402               block1[1]  = tmp2;
403               break;
404     case  4:  block1[0] |= tmp0;
405               block1[1]  = tmp1;
406               block1[2]  = tmp2;
407               break;
408     case  5:  block1[1] |= tmp0;
409               block1[2]  = tmp1;
410               block1[3]  = tmp2;
411               break;
412     case  6:  block1[2] |= tmp0;
413               block1[3]  = tmp1;
414               block2[0]  = tmp2;
415               break;
416     case  7:  block1[3] |= tmp0;
417               block2[0]  = tmp1;
418               block2[1]  = tmp2;
419               break;
420     case  8:  block2[0] |= tmp0;
421               block2[1]  = tmp1;
422               block2[2]  = tmp2;
423               break;
424     case  9:  block2[1] |= tmp0;
425               block2[2]  = tmp1;
426               block2[3]  = tmp2;
427               break;
428     case 10:  block2[2] |= tmp0;
429               block2[3]  = tmp1;
430               block3[0]  = tmp2;
431               break;
432     case 11:  block2[3] |= tmp0;
433               block3[0]  = tmp1;
434               block3[1]  = tmp2;
435               break;
436   }
437 }
438
439 static void append_1st (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append)
440 {
441   switch (block_len)
442   {
443     case 0:
444       block0[0] = append;
445       break;
446
447     case 1:
448       block0[0] = block0[0] | append <<  8;
449       break;
450
451     case 2:
452       block0[0] = block0[0] | append << 16;
453       break;
454
455     case 3:
456       block0[0] = block0[0] | append << 24;
457       break;
458
459     case 4:
460       block0[1] = append;
461       break;
462
463     case 5:
464       block0[1] = block0[1] | append <<  8;
465       break;
466
467     case 6:
468       block0[1] = block0[1] | append << 16;
469       break;
470
471     case 7:
472       block0[1] = block0[1] | append << 24;
473       break;
474
475     case 8:
476       block0[2] = append;
477       break;
478
479     case 9:
480       block0[2] = block0[2] | append <<  8;
481       break;
482
483     case 10:
484       block0[2] = block0[2] | append << 16;
485       break;
486
487     case 11:
488       block0[2] = block0[2] | append << 24;
489       break;
490
491     case 12:
492       block0[3] = append;
493       break;
494
495     case 13:
496       block0[3] = block0[3] | append <<  8;
497       break;
498
499     case 14:
500       block0[3] = block0[3] | append << 16;
501       break;
502
503     case 15:
504       block0[3] = block0[3] | append << 24;
505       break;
506
507     case 16:
508       block1[0] = append;
509       break;
510
511     case 17:
512       block1[0] = block1[0] | append <<  8;
513       break;
514
515     case 18:
516       block1[0] = block1[0] | append << 16;
517       break;
518
519     case 19:
520       block1[0] = block1[0] | append << 24;
521       break;
522
523     case 20:
524       block1[1] = append;
525       break;
526
527     case 21:
528       block1[1] = block1[1] | append <<  8;
529       break;
530
531     case 22:
532       block1[1] = block1[1] | append << 16;
533       break;
534
535     case 23:
536       block1[1] = block1[1] | append << 24;
537       break;
538
539     case 24:
540       block1[2] = append;
541       break;
542
543     case 25:
544       block1[2] = block1[2] | append <<  8;
545       break;
546
547     case 26:
548       block1[2] = block1[2] | append << 16;
549       break;
550
551     case 27:
552       block1[2] = block1[2] | append << 24;
553       break;
554
555     case 28:
556       block1[3] = append;
557       break;
558
559     case 29:
560       block1[3] = block1[3] | append <<  8;
561       break;
562
563     case 30:
564       block1[3] = block1[3] | append << 16;
565       break;
566
567     case 31:
568       block1[3] = block1[3] | append << 24;
569       break;
570
571     case 32:
572       block2[0] = append;
573       break;
574
575     case 33:
576       block2[0] = block2[0] | append <<  8;
577       break;
578
579     case 34:
580       block2[0] = block2[0] | append << 16;
581       break;
582
583     case 35:
584       block2[0] = block2[0] | append << 24;
585       break;
586
587     case 36:
588       block2[1] = append;
589       break;
590
591     case 37:
592       block2[1] = block2[1] | append <<  8;
593       break;
594
595     case 38:
596       block2[1] = block2[1] | append << 16;
597       break;
598
599     case 39:
600       block2[1] = block2[1] | append << 24;
601       break;
602
603     case 40:
604       block2[2] = append;
605       break;
606
607     case 41:
608       block2[2] = block2[2] | append <<  8;
609       break;
610
611     case 42:
612       block2[2] = block2[2] | append << 16;
613       break;
614
615     case 43:
616       block2[2] = block2[2] | append << 24;
617       break;
618
619     case 44:
620       block2[3] = append;
621       break;
622
623     case 45:
624       block2[3] = block2[3] | append <<  8;
625       break;
626
627     case 46:
628       block2[3] = block2[3] | append << 16;
629       break;
630
631     case 47:
632       block2[3] = block2[3] | append << 24;
633       break;
634
635     case 48:
636       block3[0] = append;
637       break;
638
639     case 49:
640       block3[0] = block3[0] | append <<  8;
641       break;
642
643     case 50:
644       block3[0] = block3[0] | append << 16;
645       break;
646
647     case 51:
648       block3[0] = block3[0] | append << 24;
649       break;
650
651     case 52:
652       block3[1] = append;
653       break;
654
655     case 53:
656       block3[1] = block3[1] | append <<  8;
657       break;
658
659     case 54:
660       block3[1] = block3[1] | append << 16;
661       break;
662
663     case 55:
664       block3[1] = block3[1] | append << 24;
665       break;
666
667     case 56:
668       block3[2] = append;
669       break;
670   }
671 }
672
673 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m06300_init (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
674 {
675   /**
676    * base
677    */
678
679   const u32 gid = get_global_id (0);
680
681   if (gid >= gid_max) return;
682
683   u32 w0[4];
684
685   w0[0] = pws[gid].i[0];
686   w0[1] = pws[gid].i[1];
687   w0[2] = pws[gid].i[2];
688   w0[3] = pws[gid].i[3];
689
690   const u32 pw_len = pws[gid].pw_len;
691
692   /**
693    * salt
694    */
695
696   u32 salt_buf[2];
697
698   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
699   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
700
701   const u32 salt_len = salt_bufs[salt_pos].salt_len;
702
703   /**
704    * init
705    */
706
707   //memcat16 (block0, block1, block2, block3, block_len, w0);
708   //block_len += pw_len;
709
710   u32 block_len = pw_len;
711
712   u32 block0[4];
713
714   block0[0] = w0[0];
715   block0[1] = w0[1];
716   block0[2] = w0[2];
717   block0[3] = w0[3];
718
719   u32 block1[4];
720
721   block1[0] = 0;
722   block1[1] = 0;
723   block1[2] = 0;
724   block1[3] = 0;
725
726   u32 block2[4];
727
728   block2[0] = 0;
729   block2[1] = 0;
730   block2[2] = 0;
731   block2[3] = 0;
732
733   u32 block3[4];
734
735   block3[0] = 0;
736   block3[1] = 0;
737   block3[2] = 0;
738   block3[3] = 0;
739
740   memcat8 (block0, block1, block2, block3, block_len, salt_buf);
741
742   block_len += salt_len;
743
744   memcat16 (block0, block1, block2, block3, block_len, w0);
745
746   block_len += pw_len;
747
748   append_0x80_4x4 (block0, block1, block2, block3, block_len);
749
750   block3[2] = block_len * 8;
751
752   u32 digest[4];
753
754   digest[0] = MD5M_A;
755   digest[1] = MD5M_B;
756   digest[2] = MD5M_C;
757   digest[3] = MD5M_D;
758
759   md5_transform (block0, block1, block2, block3, digest);
760
761   /* The password first, since that is what is most unknown */
762   /* Then the raw salt */
763   /* Then just as many characters of the MD5(pw,salt,pw) */
764
765   //memcat16 (block0, block1, block2, block3, block_len, w);
766   //block_len += pw_len;
767
768   block_len = pw_len;
769
770   block0[0] = w0[0];
771   block0[1] = w0[1];
772   block0[2] = w0[2];
773   block0[3] = w0[3];
774
775   block1[0] = 0;
776   block1[1] = 0;
777   block1[2] = 0;
778   block1[3] = 0;
779
780   block2[0] = 0;
781   block2[1] = 0;
782   block2[2] = 0;
783   block2[3] = 0;
784
785   block3[0] = 0;
786   block3[1] = 0;
787   block3[2] = 0;
788   block3[3] = 0;
789
790   memcat8 (block0, block1, block2, block3, block_len, salt_buf);
791
792   block_len += salt_len;
793
794   truncate_block (digest, pw_len);
795
796   memcat16 (block0, block1, block2, block3, block_len, digest);
797
798   block_len += pw_len;
799
800   /* Then something really weird... */
801
802   u32 append = block0[0] & 0xFF;
803
804   for (u32 j = pw_len; j; j >>= 1)
805   {
806     if ((j & 1) == 0)
807     {
808       append_1st (block0, block1, block2, block3, block_len, append);
809     }
810
811     block_len++;
812   }
813
814   append_0x80_4x4 (block0, block1, block2, block3, block_len);
815
816   block3[2] = block_len * 8;
817
818   digest[0] = MD5M_A;
819   digest[1] = MD5M_B;
820   digest[2] = MD5M_C;
821   digest[3] = MD5M_D;
822
823   md5_transform (block0, block1, block2, block3, digest);
824
825   tmps[gid].digest_buf[0] = digest[0];
826   tmps[gid].digest_buf[1] = digest[1];
827   tmps[gid].digest_buf[2] = digest[2];
828   tmps[gid].digest_buf[3] = digest[3];
829 }
830
831 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m06300_loop (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
832 {
833   /**
834    * base
835    */
836
837   const u32 gid = get_global_id (0);
838
839   if (gid >= gid_max) return;
840
841   u32 w0[4];
842
843   w0[0] = pws[gid].i[0];
844   w0[1] = pws[gid].i[1];
845   w0[2] = pws[gid].i[2];
846   w0[3] = pws[gid].i[3];
847
848   const u32 pw_len = pws[gid].pw_len;
849
850   u32 w0_x80[4];
851
852   w0_x80[0] = w0[0];
853   w0_x80[1] = w0[1];
854   w0_x80[2] = w0[2];
855   w0_x80[3] = w0[3];
856
857   append_0x80_1x4 (w0_x80, pw_len);
858
859   /**
860    * salt
861    */
862
863   u32 salt_buf[2];
864
865   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
866   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
867
868   const u32 salt_len = salt_bufs[salt_pos].salt_len;
869
870   /**
871    * digest
872    */
873
874   u32 digest[4];
875
876   digest[0] = tmps[gid].digest_buf[0];
877   digest[1] = tmps[gid].digest_buf[1];
878   digest[2] = tmps[gid].digest_buf[2];
879   digest[3] = tmps[gid].digest_buf[3];
880
881   /**
882    * loop
883    */
884
885   /* and now, just to make sure things don't run too fast */
886
887   u32 block_len;
888
889   u32 block0[4];
890
891   block0[0] = 0;
892   block0[1] = 0;
893   block0[2] = 0;
894   block0[3] = 0;
895
896   u32 block1[4];
897
898   block1[0] = 0;
899   block1[1] = 0;
900   block1[2] = 0;
901   block1[3] = 0;
902
903   u32 block2[4];
904
905   block2[0] = 0;
906   block2[1] = 0;
907   block2[2] = 0;
908   block2[3] = 0;
909
910   u32 block3[4];
911
912   block3[0] = 0;
913   block3[1] = 0;
914   block3[2] = 0;
915   block3[3] = 0;
916
917   for (u32 i = 0, j = loop_pos; i < loop_cnt; i++, j++)
918   {
919     block1[0] = 0;
920     block1[1] = 0;
921     block1[2] = 0;
922     block1[3] = 0;
923     block2[0] = 0;
924     block2[1] = 0;
925     block2[2] = 0;
926     block2[3] = 0;
927     block3[0] = 0;
928     block3[1] = 0;
929
930     const u32 j1 = (j & 1) ? 1 : 0;
931     const u32 j3 = (j % 3) ? 1 : 0;
932     const u32 j7 = (j % 7) ? 1 : 0;
933
934     if (j1)
935     {
936       block0[0] = w0[0];
937       block0[1] = w0[1];
938       block0[2] = w0[2];
939       block0[3] = w0[3];
940
941       block_len = pw_len;
942
943       if (j3)
944       {
945         memcat8 (block0, block1, block2, block3, block_len, salt_buf);
946
947         block_len += salt_len;
948       }
949
950       if (j7)
951       {
952         memcat16 (block0, block1, block2, block3, block_len, w0);
953
954         block_len += pw_len;
955       }
956
957       memcat16_x80 (block0, block1, block2, block3, block_len, digest);
958
959       block_len += 16;
960     }
961     else
962     {
963       block0[0] = digest[0];
964       block0[1] = digest[1];
965       block0[2] = digest[2];
966       block0[3] = digest[3];
967
968       block_len = 16;
969
970       if (j3 && j7)
971       {
972         block1[0] = salt_buf[0];
973         block1[1] = salt_buf[1];
974
975         block_len += salt_len;
976
977         memcat16 (block0, block1, block2, block3, block_len, w0);
978
979         block_len += pw_len;
980       }
981       else if (j3)
982       {
983         block1[0] = salt_buf[0];
984         block1[1] = salt_buf[1];
985
986         block_len += salt_len;
987       }
988       else if (j7)
989       {
990         block1[0] = w0[0];
991         block1[1] = w0[1];
992         block1[2] = w0[2];
993         block1[3] = w0[3];
994
995         block_len += pw_len;
996       }
997
998       memcat16 (block0, block1, block2, block3, block_len, w0_x80);
999
1000       block_len += pw_len;
1001     }
1002
1003     block3[2] = block_len * 8;
1004
1005     digest[0] = MD5M_A;
1006     digest[1] = MD5M_B;
1007     digest[2] = MD5M_C;
1008     digest[3] = MD5M_D;
1009
1010     md5_transform (block0, block1, block2, block3, digest);
1011   }
1012
1013   tmps[gid].digest_buf[0] = digest[0];
1014   tmps[gid].digest_buf[1] = digest[1];
1015   tmps[gid].digest_buf[2] = digest[2];
1016   tmps[gid].digest_buf[3] = digest[3];
1017 }
1018
1019 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m06300_comp (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
1020 {
1021   /**
1022    * modifier
1023    */
1024
1025   const u32 gid = get_global_id (0);
1026
1027   if (gid >= gid_max) return;
1028
1029   const u32 lid = get_local_id (0);
1030
1031   /**
1032    * digest
1033    */
1034
1035   const u32 r0 = tmps[gid].digest_buf[DGST_R0];
1036   const u32 r1 = tmps[gid].digest_buf[DGST_R1];
1037   const u32 r2 = tmps[gid].digest_buf[DGST_R2];
1038   const u32 r3 = tmps[gid].digest_buf[DGST_R3];
1039
1040   #define il_pos 0
1041
1042   #include COMPARE_M
1043 }