462e4ee7774294b18a7d09705e1a652bebb203f3
[hashcat.git] / OpenCL / m00500.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #include "inc_hash_constants.h"
9 #include "inc_vendor.cl"
10
11 #define DGST_R0 0
12 #define DGST_R1 1
13 #define DGST_R2 2
14 #define DGST_R3 3
15
16 #include "inc_hash_functions.cl"
17 #include "inc_types.cl"
18 #include "inc_common.cl"
19
20 #define COMPARE_S "inc_comp_single.cl"
21 #define COMPARE_M "inc_comp_multi.cl"
22
23 #define md5crypt_magic 0x00243124u
24
25 void md5_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
26 {
27   u32 a = digest[0];
28   u32 b = digest[1];
29   u32 c = digest[2];
30   u32 d = digest[3];
31
32   u32 w0_t = w0[0];
33   u32 w1_t = w0[1];
34   u32 w2_t = w0[2];
35   u32 w3_t = w0[3];
36   u32 w4_t = w1[0];
37   u32 w5_t = w1[1];
38   u32 w6_t = w1[2];
39   u32 w7_t = w1[3];
40   u32 w8_t = w2[0];
41   u32 w9_t = w2[1];
42   u32 wa_t = w2[2];
43   u32 wb_t = w2[3];
44   u32 wc_t = w3[0];
45   u32 wd_t = w3[1];
46   u32 we_t = w3[2];
47   u32 wf_t = 0;
48
49   MD5_STEP (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
50   MD5_STEP (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
51   MD5_STEP (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
52   MD5_STEP (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
53   MD5_STEP (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
54   MD5_STEP (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
55   MD5_STEP (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
56   MD5_STEP (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
57   MD5_STEP (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
58   MD5_STEP (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
59   MD5_STEP (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
60   MD5_STEP (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
61   MD5_STEP (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
62   MD5_STEP (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
63   MD5_STEP (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
64   MD5_STEP (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
65
66   MD5_STEP (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
67   MD5_STEP (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
68   MD5_STEP (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
69   MD5_STEP (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
70   MD5_STEP (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
71   MD5_STEP (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
72   MD5_STEP (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
73   MD5_STEP (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
74   MD5_STEP (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
75   MD5_STEP (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
76   MD5_STEP (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
77   MD5_STEP (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
78   MD5_STEP (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
79   MD5_STEP (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
80   MD5_STEP (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
81   MD5_STEP (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
82
83   MD5_STEP (MD5_H , a, b, c, d, w5_t, MD5C20, MD5S20);
84   MD5_STEP (MD5_H , d, a, b, c, w8_t, MD5C21, MD5S21);
85   MD5_STEP (MD5_H , c, d, a, b, wb_t, MD5C22, MD5S22);
86   MD5_STEP (MD5_H , b, c, d, a, we_t, MD5C23, MD5S23);
87   MD5_STEP (MD5_H , a, b, c, d, w1_t, MD5C24, MD5S20);
88   MD5_STEP (MD5_H , d, a, b, c, w4_t, MD5C25, MD5S21);
89   MD5_STEP (MD5_H , c, d, a, b, w7_t, MD5C26, MD5S22);
90   MD5_STEP (MD5_H , b, c, d, a, wa_t, MD5C27, MD5S23);
91   MD5_STEP (MD5_H , a, b, c, d, wd_t, MD5C28, MD5S20);
92   MD5_STEP (MD5_H , d, a, b, c, w0_t, MD5C29, MD5S21);
93   MD5_STEP (MD5_H , c, d, a, b, w3_t, MD5C2a, MD5S22);
94   MD5_STEP (MD5_H , b, c, d, a, w6_t, MD5C2b, MD5S23);
95   MD5_STEP (MD5_H , a, b, c, d, w9_t, MD5C2c, MD5S20);
96   MD5_STEP (MD5_H , d, a, b, c, wc_t, MD5C2d, MD5S21);
97   MD5_STEP (MD5_H , c, d, a, b, wf_t, MD5C2e, MD5S22);
98   MD5_STEP (MD5_H , b, c, d, a, w2_t, MD5C2f, MD5S23);
99
100   MD5_STEP (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
101   MD5_STEP (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
102   MD5_STEP (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
103   MD5_STEP (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
104   MD5_STEP (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
105   MD5_STEP (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
106   MD5_STEP (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
107   MD5_STEP (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
108   MD5_STEP (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
109   MD5_STEP (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
110   MD5_STEP (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
111   MD5_STEP (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
112   MD5_STEP (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
113   MD5_STEP (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
114   MD5_STEP (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
115   MD5_STEP (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
116
117   digest[0] += a;
118   digest[1] += b;
119   digest[2] += c;
120   digest[3] += d;
121 }
122
123 void memcat16 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[4])
124 {
125   u32 tmp0;
126   u32 tmp1;
127   u32 tmp2;
128   u32 tmp3;
129   u32 tmp4;
130
131   #if defined IS_AMD || defined IS_GENERIC
132
133   const int offset_minus_4 = 4 - (block_len & 3);
134
135   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
136   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
137   tmp2 = amd_bytealign (append[2], append[1], offset_minus_4);
138   tmp3 = amd_bytealign (append[3], append[2], offset_minus_4);
139   tmp4 = amd_bytealign (        0, append[3], offset_minus_4);
140
141   const u32 mod = block_len & 3;
142
143   if (mod == 0)
144   {
145     tmp0 = tmp1;
146     tmp1 = tmp2;
147     tmp2 = tmp3;
148     tmp3 = tmp4;
149     tmp4 = 0;
150   }
151
152   #endif
153
154   #ifdef IS_NV
155
156   const int offset_minus_4 = 4 - (block_len & 3);
157
158   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
159
160   tmp0 = __byte_perm (        0, append[0], selector);
161   tmp1 = __byte_perm (append[0], append[1], selector);
162   tmp2 = __byte_perm (append[1], append[2], selector);
163   tmp3 = __byte_perm (append[2], append[3], selector);
164   tmp4 = __byte_perm (append[3],         0, selector);
165
166   #endif
167
168   const u32 div = block_len / 4;
169
170   switch (div)
171   {
172     case  0:  block0[0] |= tmp0;
173               block0[1]  = tmp1;
174               block0[2]  = tmp2;
175               block0[3]  = tmp3;
176               block1[0]  = tmp4;
177               break;
178     case  1:  block0[1] |= tmp0;
179               block0[2]  = tmp1;
180               block0[3]  = tmp2;
181               block1[0]  = tmp3;
182               block1[1]  = tmp4;
183               break;
184     case  2:  block0[2] |= tmp0;
185               block0[3]  = tmp1;
186               block1[0]  = tmp2;
187               block1[1]  = tmp3;
188               block1[2]  = tmp4;
189               break;
190     case  3:  block0[3] |= tmp0;
191               block1[0]  = tmp1;
192               block1[1]  = tmp2;
193               block1[2]  = tmp3;
194               block1[3]  = tmp4;
195               break;
196     case  4:  block1[0] |= tmp0;
197               block1[1]  = tmp1;
198               block1[2]  = tmp2;
199               block1[3]  = tmp3;
200               block2[0]  = tmp4;
201               break;
202     case  5:  block1[1] |= tmp0;
203               block1[2]  = tmp1;
204               block1[3]  = tmp2;
205               block2[0]  = tmp3;
206               block2[1]  = tmp4;
207               break;
208     case  6:  block1[2] |= tmp0;
209               block1[3]  = tmp1;
210               block2[0]  = tmp2;
211               block2[1]  = tmp3;
212               block2[2]  = tmp4;
213               break;
214     case  7:  block1[3] |= tmp0;
215               block2[0]  = tmp1;
216               block2[1]  = tmp2;
217               block2[2]  = tmp3;
218               block2[3]  = tmp4;
219               break;
220     case  8:  block2[0] |= tmp0;
221               block2[1]  = tmp1;
222               block2[2]  = tmp2;
223               block2[3]  = tmp3;
224               block3[0]  = tmp4;
225               break;
226     case  9:  block2[1] |= tmp0;
227               block2[2]  = tmp1;
228               block2[3]  = tmp2;
229               block3[0]  = tmp3;
230               block3[1]  = tmp4;
231               break;
232   }
233 }
234
235 void memcat16_x80 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[4])
236 {
237   u32 tmp0;
238   u32 tmp1;
239   u32 tmp2;
240   u32 tmp3;
241   u32 tmp4;
242
243   #if defined IS_AMD || defined IS_GENERIC
244
245   const int offset_minus_4 = 4 - (block_len & 3);
246
247   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
248   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
249   tmp2 = amd_bytealign (append[2], append[1], offset_minus_4);
250   tmp3 = amd_bytealign (append[3], append[2], offset_minus_4);
251   tmp4 = amd_bytealign (     0x80, append[3], offset_minus_4);
252
253   const u32 mod = block_len & 3;
254
255   if (mod == 0)
256   {
257     tmp0 = tmp1;
258     tmp1 = tmp2;
259     tmp2 = tmp3;
260     tmp3 = tmp4;
261     tmp4 = 0x80;
262   }
263
264   #endif
265
266   #ifdef IS_NV
267
268   const int offset_minus_4 = 4 - (block_len & 3);
269
270   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
271
272   tmp0 = __byte_perm (        0, append[0], selector);
273   tmp1 = __byte_perm (append[0], append[1], selector);
274   tmp2 = __byte_perm (append[1], append[2], selector);
275   tmp3 = __byte_perm (append[2], append[3], selector);
276   tmp4 = __byte_perm (append[3],      0x80, selector);
277
278   #endif
279
280   const u32 div = block_len / 4;
281
282   switch (div)
283   {
284     case  0:  block0[0] |= tmp0;
285               block0[1]  = tmp1;
286               block0[2]  = tmp2;
287               block0[3]  = tmp3;
288               block1[0]  = tmp4;
289               break;
290     case  1:  block0[1] |= tmp0;
291               block0[2]  = tmp1;
292               block0[3]  = tmp2;
293               block1[0]  = tmp3;
294               block1[1]  = tmp4;
295               break;
296     case  2:  block0[2] |= tmp0;
297               block0[3]  = tmp1;
298               block1[0]  = tmp2;
299               block1[1]  = tmp3;
300               block1[2]  = tmp4;
301               break;
302     case  3:  block0[3] |= tmp0;
303               block1[0]  = tmp1;
304               block1[1]  = tmp2;
305               block1[2]  = tmp3;
306               block1[3]  = tmp4;
307               break;
308     case  4:  block1[0] |= tmp0;
309               block1[1]  = tmp1;
310               block1[2]  = tmp2;
311               block1[3]  = tmp3;
312               block2[0]  = tmp4;
313               break;
314     case  5:  block1[1] |= tmp0;
315               block1[2]  = tmp1;
316               block1[3]  = tmp2;
317               block2[0]  = tmp3;
318               block2[1]  = tmp4;
319               break;
320     case  6:  block1[2] |= tmp0;
321               block1[3]  = tmp1;
322               block2[0]  = tmp2;
323               block2[1]  = tmp3;
324               block2[2]  = tmp4;
325               break;
326     case  7:  block1[3] |= tmp0;
327               block2[0]  = tmp1;
328               block2[1]  = tmp2;
329               block2[2]  = tmp3;
330               block2[3]  = tmp4;
331               break;
332     case  8:  block2[0] |= tmp0;
333               block2[1]  = tmp1;
334               block2[2]  = tmp2;
335               block2[3]  = tmp3;
336               block3[0]  = tmp4;
337               break;
338     case  9:  block2[1] |= tmp0;
339               block2[2]  = tmp1;
340               block2[3]  = tmp2;
341               block3[0]  = tmp3;
342               block3[1]  = tmp4;
343               break;
344   }
345 }
346
347 void memcat8 (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append[2])
348 {
349   u32 tmp0;
350   u32 tmp1;
351   u32 tmp2;
352
353   #if defined IS_AMD || defined IS_GENERIC
354
355   const int offset_minus_4 = 4 - (block_len & 3);
356
357   tmp0 = amd_bytealign (append[0],         0, offset_minus_4);
358   tmp1 = amd_bytealign (append[1], append[0], offset_minus_4);
359   tmp2 = amd_bytealign (        0, append[1], offset_minus_4);
360
361   const u32 mod = block_len & 3;
362
363   if (mod == 0)
364   {
365     tmp0 = tmp1;
366     tmp1 = tmp2;
367     tmp2 = 0;
368   }
369
370   #endif
371
372   #ifdef IS_NV
373
374   const int offset_minus_4 = 4 - (block_len & 3);
375
376   const int selector = (0x76543210 >> (offset_minus_4 * 4)) & 0xffff;
377
378   tmp0 = __byte_perm (        0, append[0], selector);
379   tmp1 = __byte_perm (append[0], append[1], selector);
380   tmp2 = __byte_perm (append[1],         0, selector);
381
382   #endif
383
384   const u32 div = block_len / 4;
385
386   switch (div)
387   {
388     case  0:  block0[0] |= tmp0;
389               block0[1]  = tmp1;
390               block0[2]  = tmp2;
391               break;
392     case  1:  block0[1] |= tmp0;
393               block0[2]  = tmp1;
394               block0[3]  = tmp2;
395               break;
396     case  2:  block0[2] |= tmp0;
397               block0[3]  = tmp1;
398               block1[0]  = tmp2;
399               break;
400     case  3:  block0[3] |= tmp0;
401               block1[0]  = tmp1;
402               block1[1]  = tmp2;
403               break;
404     case  4:  block1[0] |= tmp0;
405               block1[1]  = tmp1;
406               block1[2]  = tmp2;
407               break;
408     case  5:  block1[1] |= tmp0;
409               block1[2]  = tmp1;
410               block1[3]  = tmp2;
411               break;
412     case  6:  block1[2] |= tmp0;
413               block1[3]  = tmp1;
414               block2[0]  = tmp2;
415               break;
416     case  7:  block1[3] |= tmp0;
417               block2[0]  = tmp1;
418               block2[1]  = tmp2;
419               break;
420     case  8:  block2[0] |= tmp0;
421               block2[1]  = tmp1;
422               block2[2]  = tmp2;
423               break;
424     case  9:  block2[1] |= tmp0;
425               block2[2]  = tmp1;
426               block2[3]  = tmp2;
427               break;
428     case 10:  block2[2] |= tmp0;
429               block2[3]  = tmp1;
430               block3[0]  = tmp2;
431               break;
432     case 11:  block2[3] |= tmp0;
433               block3[0]  = tmp1;
434               block3[1]  = tmp2;
435               break;
436   }
437 }
438
439 void append_sign (u32 block0[4], u32 block1[4], const u32 block_len)
440 {
441   switch (block_len)
442   {
443     case 0:
444       block0[0] = md5crypt_magic;
445       break;
446
447     case 1:
448       block0[0] = block0[0]            | md5crypt_magic <<  8u;
449       block0[1] = md5crypt_magic >> 24u;
450       break;
451
452     case 2:
453       block0[0] = block0[0]            | md5crypt_magic << 16u;
454       block0[1] = md5crypt_magic >> 16u;
455       break;
456
457     case 3:
458       block0[0] = block0[0]            | md5crypt_magic << 24u;
459       block0[1] = md5crypt_magic >>  8u;
460       break;
461
462     case 4:
463       block0[1] = md5crypt_magic;
464       break;
465
466     case 5:
467       block0[1] = block0[1]            | md5crypt_magic <<  8u;
468       block0[2] = md5crypt_magic >> 24u;
469       break;
470
471     case 6:
472       block0[1] = block0[1]            | md5crypt_magic << 16u;
473       block0[2] = md5crypt_magic >> 16u;
474       break;
475
476     case 7:
477       block0[1] = block0[1]            | md5crypt_magic << 24u;
478       block0[2] = md5crypt_magic >>  8u;
479       break;
480
481     case 8:
482       block0[2] = md5crypt_magic;
483       break;
484
485     case 9:
486       block0[2] = block0[2]            | md5crypt_magic <<  8u;
487       block0[3] = md5crypt_magic >> 24u;
488       break;
489
490     case 10:
491       block0[2] = block0[2]            | md5crypt_magic << 16u;
492       block0[3] = md5crypt_magic >> 16u;
493       break;
494
495     case 11:
496       block0[2] = block0[2]            | md5crypt_magic << 24u;
497       block0[3] = md5crypt_magic >>  8u;
498       break;
499
500     case 12:
501       block0[3] = md5crypt_magic;
502       break;
503
504     case 13:
505       block0[3] = block0[3]            | md5crypt_magic <<  8u;
506       block1[0] = md5crypt_magic >> 24u;
507       break;
508
509     case 14:
510       block0[3] = block0[3]            | md5crypt_magic << 16u;
511       block1[0] = md5crypt_magic >> 16u;
512       break;
513
514     case 15:
515       block0[3] = block0[3]            | md5crypt_magic << 24u;
516       block1[0] = md5crypt_magic >>  8u;
517       break;
518   }
519 }
520
521 void append_1st (u32 block0[4], u32 block1[4], u32 block2[4], u32 block3[4], const u32 block_len, const u32 append)
522 {
523   switch (block_len)
524   {
525     case 0:
526       block0[0] = append;
527       break;
528
529     case 1:
530       block0[0] = block0[0] | append <<  8;
531       break;
532
533     case 2:
534       block0[0] = block0[0] | append << 16;
535       break;
536
537     case 3:
538       block0[0] = block0[0] | append << 24;
539       break;
540
541     case 4:
542       block0[1] = append;
543       break;
544
545     case 5:
546       block0[1] = block0[1] | append <<  8;
547       break;
548
549     case 6:
550       block0[1] = block0[1] | append << 16;
551       break;
552
553     case 7:
554       block0[1] = block0[1] | append << 24;
555       break;
556
557     case 8:
558       block0[2] = append;
559       break;
560
561     case 9:
562       block0[2] = block0[2] | append <<  8;
563       break;
564
565     case 10:
566       block0[2] = block0[2] | append << 16;
567       break;
568
569     case 11:
570       block0[2] = block0[2] | append << 24;
571       break;
572
573     case 12:
574       block0[3] = append;
575       break;
576
577     case 13:
578       block0[3] = block0[3] | append <<  8;
579       break;
580
581     case 14:
582       block0[3] = block0[3] | append << 16;
583       break;
584
585     case 15:
586       block0[3] = block0[3] | append << 24;
587       break;
588
589     case 16:
590       block1[0] = append;
591       break;
592
593     case 17:
594       block1[0] = block1[0] | append <<  8;
595       break;
596
597     case 18:
598       block1[0] = block1[0] | append << 16;
599       break;
600
601     case 19:
602       block1[0] = block1[0] | append << 24;
603       break;
604
605     case 20:
606       block1[1] = append;
607       break;
608
609     case 21:
610       block1[1] = block1[1] | append <<  8;
611       break;
612
613     case 22:
614       block1[1] = block1[1] | append << 16;
615       break;
616
617     case 23:
618       block1[1] = block1[1] | append << 24;
619       break;
620
621     case 24:
622       block1[2] = append;
623       break;
624
625     case 25:
626       block1[2] = block1[2] | append <<  8;
627       break;
628
629     case 26:
630       block1[2] = block1[2] | append << 16;
631       break;
632
633     case 27:
634       block1[2] = block1[2] | append << 24;
635       break;
636
637     case 28:
638       block1[3] = append;
639       break;
640
641     case 29:
642       block1[3] = block1[3] | append <<  8;
643       break;
644
645     case 30:
646       block1[3] = block1[3] | append << 16;
647       break;
648
649     case 31:
650       block1[3] = block1[3] | append << 24;
651       break;
652
653     case 32:
654       block2[0] = append;
655       break;
656
657     case 33:
658       block2[0] = block2[0] | append <<  8;
659       break;
660
661     case 34:
662       block2[0] = block2[0] | append << 16;
663       break;
664
665     case 35:
666       block2[0] = block2[0] | append << 24;
667       break;
668
669     case 36:
670       block2[1] = append;
671       break;
672
673     case 37:
674       block2[1] = block2[1] | append <<  8;
675       break;
676
677     case 38:
678       block2[1] = block2[1] | append << 16;
679       break;
680
681     case 39:
682       block2[1] = block2[1] | append << 24;
683       break;
684
685     case 40:
686       block2[2] = append;
687       break;
688
689     case 41:
690       block2[2] = block2[2] | append <<  8;
691       break;
692
693     case 42:
694       block2[2] = block2[2] | append << 16;
695       break;
696
697     case 43:
698       block2[2] = block2[2] | append << 24;
699       break;
700
701     case 44:
702       block2[3] = append;
703       break;
704
705     case 45:
706       block2[3] = block2[3] | append <<  8;
707       break;
708
709     case 46:
710       block2[3] = block2[3] | append << 16;
711       break;
712
713     case 47:
714       block2[3] = block2[3] | append << 24;
715       break;
716
717     case 48:
718       block3[0] = append;
719       break;
720
721     case 49:
722       block3[0] = block3[0] | append <<  8;
723       break;
724
725     case 50:
726       block3[0] = block3[0] | append << 16;
727       break;
728
729     case 51:
730       block3[0] = block3[0] | append << 24;
731       break;
732
733     case 52:
734       block3[1] = append;
735       break;
736
737     case 53:
738       block3[1] = block3[1] | append <<  8;
739       break;
740
741     case 54:
742       block3[1] = block3[1] | append << 16;
743       break;
744
745     case 55:
746       block3[1] = block3[1] | append << 24;
747       break;
748
749     case 56:
750       block3[2] = append;
751       break;
752   }
753 }
754
755 __kernel void m00500_init (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
756 {
757   /**
758    * base
759    */
760
761   const u32 gid = get_global_id (0);
762
763   if (gid >= gid_max) return;
764
765   u32 w0[4];
766
767   w0[0] = pws[gid].i[0];
768   w0[1] = pws[gid].i[1];
769   w0[2] = pws[gid].i[2];
770   w0[3] = pws[gid].i[3];
771
772   const u32 pw_len = pws[gid].pw_len;
773
774   /**
775    * salt
776    */
777
778   u32 salt_buf[2];
779
780   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
781   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
782
783   const u32 salt_len = salt_bufs[salt_pos].salt_len;
784
785   /**
786    * init
787    */
788
789   //memcat16 (block0, block1, block2, block3, block_len, w0);
790   //block_len += pw_len;
791
792   u32 block_len = pw_len;
793
794   u32 block0[4];
795
796   block0[0] = w0[0];
797   block0[1] = w0[1];
798   block0[2] = w0[2];
799   block0[3] = w0[3];
800
801   u32 block1[4];
802
803   block1[0] = 0;
804   block1[1] = 0;
805   block1[2] = 0;
806   block1[3] = 0;
807
808   u32 block2[4];
809
810   block2[0] = 0;
811   block2[1] = 0;
812   block2[2] = 0;
813   block2[3] = 0;
814
815   u32 block3[4];
816
817   block3[0] = 0;
818   block3[1] = 0;
819   block3[2] = 0;
820   block3[3] = 0;
821
822   memcat8 (block0, block1, block2, block3, block_len, salt_buf);
823
824   block_len += salt_len;
825
826   memcat16 (block0, block1, block2, block3, block_len, w0);
827
828   block_len += pw_len;
829
830   append_0x80_4x4 (block0, block1, block2, block3, block_len);
831
832   block3[2] = block_len * 8;
833
834   u32 digest[4];
835
836   digest[0] = MD5M_A;
837   digest[1] = MD5M_B;
838   digest[2] = MD5M_C;
839   digest[3] = MD5M_D;
840
841   md5_transform (block0, block1, block2, block3, digest);
842
843   /* The password first, since that is what is most unknown */
844   /* Then our magic string */
845   /* Then the raw salt */
846   /* Then just as many characters of the MD5(pw,salt,pw) */
847
848   //memcat16 (block0, block1, block2, block3, block_len, w);
849   //block_len += pw_len;
850
851   block_len = pw_len;
852
853   block0[0] = w0[0];
854   block0[1] = w0[1];
855   block0[2] = w0[2];
856   block0[3] = w0[3];
857
858   block1[0] = 0;
859   block1[1] = 0;
860   block1[2] = 0;
861   block1[3] = 0;
862
863   block2[0] = 0;
864   block2[1] = 0;
865   block2[2] = 0;
866   block2[3] = 0;
867
868   block3[0] = 0;
869   block3[1] = 0;
870   block3[2] = 0;
871   block3[3] = 0;
872
873   append_sign (block0, block1, block_len);
874
875   block_len += 3;
876
877   memcat8 (block0, block1, block2, block3, block_len, salt_buf);
878
879   block_len += salt_len;
880
881   truncate_block (digest, pw_len);
882
883   memcat16 (block0, block1, block2, block3, block_len, digest);
884
885   block_len += pw_len;
886
887   /* Then something really weird... */
888
889   u32 append = block0[0] & 0xFF;
890
891   for (u32 j = pw_len; j; j >>= 1)
892   {
893     if ((j & 1) == 0)
894     {
895       append_1st (block0, block1, block2, block3, block_len, append);
896     }
897
898     block_len++;
899   }
900
901   append_0x80_4x4 (block0, block1, block2, block3, block_len);
902
903   block3[2] = block_len * 8;
904
905   digest[0] = MD5M_A;
906   digest[1] = MD5M_B;
907   digest[2] = MD5M_C;
908   digest[3] = MD5M_D;
909
910   md5_transform (block0, block1, block2, block3, digest);
911
912   tmps[gid].digest_buf[0] = digest[0];
913   tmps[gid].digest_buf[1] = digest[1];
914   tmps[gid].digest_buf[2] = digest[2];
915   tmps[gid].digest_buf[3] = digest[3];
916 }
917
918 __kernel void m00500_loop (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
919 {
920   /**
921    * base
922    */
923
924   const u32 gid = get_global_id (0);
925
926   if (gid >= gid_max) return;
927
928   u32 w0[4];
929
930   w0[0] = pws[gid].i[0];
931   w0[1] = pws[gid].i[1];
932   w0[2] = pws[gid].i[2];
933   w0[3] = pws[gid].i[3];
934
935   const u32 pw_len = pws[gid].pw_len;
936
937   u32 w0_x80[4];
938
939   w0_x80[0] = w0[0];
940   w0_x80[1] = w0[1];
941   w0_x80[2] = w0[2];
942   w0_x80[3] = w0[3];
943
944   append_0x80_1x4 (w0_x80, pw_len);
945
946   /**
947    * salt
948    */
949
950   u32 salt_buf[2];
951
952   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
953   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
954
955   const u32 salt_len = salt_bufs[salt_pos].salt_len;
956
957   /**
958    * digest
959    */
960
961   u32 digest[4];
962
963   digest[0] = tmps[gid].digest_buf[0];
964   digest[1] = tmps[gid].digest_buf[1];
965   digest[2] = tmps[gid].digest_buf[2];
966   digest[3] = tmps[gid].digest_buf[3];
967
968   /**
969    * loop
970    */
971
972   /* and now, just to make sure things don't run too fast */
973
974   u32 block_len;
975
976   u32 block0[4];
977
978   block0[0] = 0;
979   block0[1] = 0;
980   block0[2] = 0;
981   block0[3] = 0;
982
983   u32 block1[4];
984
985   block1[0] = 0;
986   block1[1] = 0;
987   block1[2] = 0;
988   block1[3] = 0;
989
990   u32 block2[4];
991
992   block2[0] = 0;
993   block2[1] = 0;
994   block2[2] = 0;
995   block2[3] = 0;
996
997   u32 block3[4];
998
999   block3[0] = 0;
1000   block3[1] = 0;
1001   block3[2] = 0;
1002   block3[3] = 0;
1003
1004   for (u32 i = 0, j = loop_pos; i < loop_cnt; i++, j++)
1005   {
1006     block1[0] = 0;
1007     block1[1] = 0;
1008     block1[2] = 0;
1009     block1[3] = 0;
1010     block2[0] = 0;
1011     block2[1] = 0;
1012     block2[2] = 0;
1013     block2[3] = 0;
1014     block3[0] = 0;
1015     block3[1] = 0;
1016
1017     const u32 j1 = (j & 1) ? 1 : 0;
1018     const u32 j3 = (j % 3) ? 1 : 0;
1019     const u32 j7 = (j % 7) ? 1 : 0;
1020
1021     if (j1)
1022     {
1023       block0[0] = w0[0];
1024       block0[1] = w0[1];
1025       block0[2] = w0[2];
1026       block0[3] = w0[3];
1027
1028       block_len = pw_len;
1029
1030       if (j3)
1031       {
1032         memcat8 (block0, block1, block2, block3, block_len, salt_buf);
1033
1034         block_len += salt_len;
1035       }
1036
1037       if (j7)
1038       {
1039         memcat16 (block0, block1, block2, block3, block_len, w0);
1040
1041         block_len += pw_len;
1042       }
1043
1044       memcat16_x80 (block0, block1, block2, block3, block_len, digest);
1045
1046       block_len += 16;
1047     }
1048     else
1049     {
1050       block0[0] = digest[0];
1051       block0[1] = digest[1];
1052       block0[2] = digest[2];
1053       block0[3] = digest[3];
1054
1055       block_len = 16;
1056
1057       if (j3 && j7)
1058       {
1059         block1[0] = salt_buf[0];
1060         block1[1] = salt_buf[1];
1061
1062         block_len += salt_len;
1063
1064         memcat16 (block0, block1, block2, block3, block_len, w0);
1065
1066         block_len += pw_len;
1067       }
1068       else if (j3)
1069       {
1070         block1[0] = salt_buf[0];
1071         block1[1] = salt_buf[1];
1072
1073         block_len += salt_len;
1074       }
1075       else if (j7)
1076       {
1077         block1[0] = w0[0];
1078         block1[1] = w0[1];
1079         block1[2] = w0[2];
1080         block1[3] = w0[3];
1081
1082         block_len += pw_len;
1083       }
1084
1085       memcat16 (block0, block1, block2, block3, block_len, w0_x80);
1086
1087       block_len += pw_len;
1088     }
1089
1090     block3[2] = block_len * 8;
1091
1092     digest[0] = MD5M_A;
1093     digest[1] = MD5M_B;
1094     digest[2] = MD5M_C;
1095     digest[3] = MD5M_D;
1096
1097     md5_transform (block0, block1, block2, block3, digest);
1098   }
1099
1100   tmps[gid].digest_buf[0] = digest[0];
1101   tmps[gid].digest_buf[1] = digest[1];
1102   tmps[gid].digest_buf[2] = digest[2];
1103   tmps[gid].digest_buf[3] = digest[3];
1104 }
1105
1106 __kernel void m00500_comp (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global md5crypt_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
1107 {
1108   /**
1109    * modifier
1110    */
1111
1112   const u32 gid = get_global_id (0);
1113
1114   if (gid >= gid_max) return;
1115
1116   const u32 lid = get_local_id (0);
1117
1118   /**
1119    * digest
1120    */
1121
1122   const u32 r0 = tmps[gid].digest_buf[DGST_R0];
1123   const u32 r1 = tmps[gid].digest_buf[DGST_R1];
1124   const u32 r2 = tmps[gid].digest_buf[DGST_R2];
1125   const u32 r3 = tmps[gid].digest_buf[DGST_R3];
1126
1127   #define il_pos 0
1128
1129   #include COMPARE_M
1130 }