b26f455fc2c0af6d72f361a8541850064fb1ff87
[hashcat.git] / OpenCL / m10400_a3.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _MD5_
9
10 //too much register pressure
11 //#define NEW_SIMD_CODE
12
13 #include "inc_hash_constants.h"
14 #include "inc_vendor.cl"
15
16 #define DGST_R0 0
17 #define DGST_R1 1
18 #define DGST_R2 2
19 #define DGST_R3 3
20
21 #include "inc_hash_functions.cl"
22 #include "inc_types.cl"
23 #include "inc_common.cl"
24 #include "inc_simd.cl"
25
26 __constant u32 padding[8] =
27 {
28   0x5e4ebf28,
29   0x418a754e,
30   0x564e0064,
31   0x0801faff,
32   0xb6002e2e,
33   0x803e68d0,
34   0xfea90c2f,
35   0x7a695364
36 };
37
38 typedef struct
39 {
40   u8 S[256];
41
42   u32 wtf_its_faster;
43
44 } RC4_KEY;
45
46 void swap (__local RC4_KEY *rc4_key, const u8 i, const u8 j)
47 {
48   u8 tmp;
49
50   tmp           = rc4_key->S[i];
51   rc4_key->S[i] = rc4_key->S[j];
52   rc4_key->S[j] = tmp;
53 }
54
55 void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
56 {
57   u32 v = 0x03020100;
58   u32 a = 0x04040404;
59
60   __local u32 *ptr = (__local u32 *) rc4_key->S;
61
62   #ifdef _unroll
63   #pragma unroll
64   #endif
65   for (u32 i = 0; i < 64; i++)
66   {
67     ptr[i] = v; v += a;
68   }
69
70   const u32 d0 = data[0] >>  0;
71   const u32 d1 = data[0] >>  8;
72   const u32 d2 = data[0] >> 16;
73   const u32 d3 = data[0] >> 24;
74   const u32 d4 = data[1] >>  0;
75
76   u32 j = 0;
77
78   #ifdef _unroll
79   #pragma unroll
80   #endif
81   for (u32 i = 0; i < 255; i += 5)
82   {
83     j += rc4_key->S[i + 0] + d0; swap (rc4_key, i + 0, j);
84     j += rc4_key->S[i + 1] + d1; swap (rc4_key, i + 1, j);
85     j += rc4_key->S[i + 2] + d2; swap (rc4_key, i + 2, j);
86     j += rc4_key->S[i + 3] + d3; swap (rc4_key, i + 3, j);
87     j += rc4_key->S[i + 4] + d4; swap (rc4_key, i + 4, j);
88   }
89
90   j += rc4_key->S[255] + d0; swap (rc4_key, 255, j);
91 }
92
93 u8 rc4_next_16 (__local RC4_KEY *rc4_key, u8 i, u8 j, __constant u32 *in, u32 out[4])
94 {
95   #ifdef _unroll
96   #pragma unroll
97   #endif
98   for (u32 k = 0; k < 4; k++)
99   {
100     u32 xor4 = 0;
101
102     u8 idx;
103
104     i += 1;
105     j += rc4_key->S[i];
106
107     swap (rc4_key, i, j);
108
109     idx = rc4_key->S[i] + rc4_key->S[j];
110
111     xor4 |= rc4_key->S[idx] <<  0;
112
113     i += 1;
114     j += rc4_key->S[i];
115
116     swap (rc4_key, i, j);
117
118     idx = rc4_key->S[i] + rc4_key->S[j];
119
120     xor4 |= rc4_key->S[idx] <<  8;
121
122     i += 1;
123     j += rc4_key->S[i];
124
125     swap (rc4_key, i, j);
126
127     idx = rc4_key->S[i] + rc4_key->S[j];
128
129     xor4 |= rc4_key->S[idx] << 16;
130
131     i += 1;
132     j += rc4_key->S[i];
133
134     swap (rc4_key, i, j);
135
136     idx = rc4_key->S[i] + rc4_key->S[j];
137
138     xor4 |= rc4_key->S[idx] << 24;
139
140     out[k] = in[k] ^ xor4;
141   }
142
143   return j;
144 }
145
146 void md5_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
147 {
148   u32 a = digest[0];
149   u32 b = digest[1];
150   u32 c = digest[2];
151   u32 d = digest[3];
152
153   u32 w0_t = w0[0];
154   u32 w1_t = w0[1];
155   u32 w2_t = w0[2];
156   u32 w3_t = w0[3];
157   u32 w4_t = w1[0];
158   u32 w5_t = w1[1];
159   u32 w6_t = w1[2];
160   u32 w7_t = w1[3];
161   u32 w8_t = w2[0];
162   u32 w9_t = w2[1];
163   u32 wa_t = w2[2];
164   u32 wb_t = w2[3];
165   u32 wc_t = w3[0];
166   u32 wd_t = w3[1];
167   u32 we_t = w3[2];
168   u32 wf_t = w3[3];
169
170   MD5_STEP (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
171   MD5_STEP (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
172   MD5_STEP (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
173   MD5_STEP (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
174   MD5_STEP (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
175   MD5_STEP (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
176   MD5_STEP (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
177   MD5_STEP (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
178   MD5_STEP (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
179   MD5_STEP (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
180   MD5_STEP (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
181   MD5_STEP (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
182   MD5_STEP (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
183   MD5_STEP (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
184   MD5_STEP (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
185   MD5_STEP (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
186
187   MD5_STEP (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
188   MD5_STEP (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
189   MD5_STEP (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
190   MD5_STEP (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
191   MD5_STEP (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
192   MD5_STEP (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
193   MD5_STEP (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
194   MD5_STEP (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
195   MD5_STEP (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
196   MD5_STEP (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
197   MD5_STEP (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
198   MD5_STEP (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
199   MD5_STEP (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
200   MD5_STEP (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
201   MD5_STEP (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
202   MD5_STEP (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
203
204   MD5_STEP (MD5_H , a, b, c, d, w5_t, MD5C20, MD5S20);
205   MD5_STEP (MD5_H , d, a, b, c, w8_t, MD5C21, MD5S21);
206   MD5_STEP (MD5_H , c, d, a, b, wb_t, MD5C22, MD5S22);
207   MD5_STEP (MD5_H , b, c, d, a, we_t, MD5C23, MD5S23);
208   MD5_STEP (MD5_H , a, b, c, d, w1_t, MD5C24, MD5S20);
209   MD5_STEP (MD5_H , d, a, b, c, w4_t, MD5C25, MD5S21);
210   MD5_STEP (MD5_H , c, d, a, b, w7_t, MD5C26, MD5S22);
211   MD5_STEP (MD5_H , b, c, d, a, wa_t, MD5C27, MD5S23);
212   MD5_STEP (MD5_H , a, b, c, d, wd_t, MD5C28, MD5S20);
213   MD5_STEP (MD5_H , d, a, b, c, w0_t, MD5C29, MD5S21);
214   MD5_STEP (MD5_H , c, d, a, b, w3_t, MD5C2a, MD5S22);
215   MD5_STEP (MD5_H , b, c, d, a, w6_t, MD5C2b, MD5S23);
216   MD5_STEP (MD5_H , a, b, c, d, w9_t, MD5C2c, MD5S20);
217   MD5_STEP (MD5_H , d, a, b, c, wc_t, MD5C2d, MD5S21);
218   MD5_STEP (MD5_H , c, d, a, b, wf_t, MD5C2e, MD5S22);
219   MD5_STEP (MD5_H , b, c, d, a, w2_t, MD5C2f, MD5S23);
220
221   MD5_STEP (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
222   MD5_STEP (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
223   MD5_STEP (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
224   MD5_STEP (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
225   MD5_STEP (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
226   MD5_STEP (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
227   MD5_STEP (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
228   MD5_STEP (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
229   MD5_STEP (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
230   MD5_STEP (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
231   MD5_STEP (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
232   MD5_STEP (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
233   MD5_STEP (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
234   MD5_STEP (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
235   MD5_STEP (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
236   MD5_STEP (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
237
238   digest[0] += a;
239   digest[1] += b;
240   digest[2] += c;
241   digest[3] += d;
242 }
243
244 void m10400m (__local RC4_KEY *rc4_keys, u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset)
245 {
246   /**
247    * modifier
248    */
249
250   const u32 gid = get_global_id (0);
251   const u32 lid = get_local_id (0);
252
253   /**
254    * shared
255    */
256
257   __local RC4_KEY *rc4_key = &rc4_keys[lid];
258
259   /**
260    * U_buf
261    */
262
263   u32 o_buf[8];
264
265   o_buf[0] = pdf_bufs[salt_pos].o_buf[0];
266   o_buf[1] = pdf_bufs[salt_pos].o_buf[1];
267   o_buf[2] = pdf_bufs[salt_pos].o_buf[2];
268   o_buf[3] = pdf_bufs[salt_pos].o_buf[3];
269   o_buf[4] = pdf_bufs[salt_pos].o_buf[4];
270   o_buf[5] = pdf_bufs[salt_pos].o_buf[5];
271   o_buf[6] = pdf_bufs[salt_pos].o_buf[6];
272   o_buf[7] = pdf_bufs[salt_pos].o_buf[7];
273
274   u32 P = pdf_bufs[salt_pos].P;
275
276   u32 id_buf[4];
277
278   id_buf[0] = pdf_bufs[salt_pos].id_buf[0];
279   id_buf[1] = pdf_bufs[salt_pos].id_buf[1];
280   id_buf[2] = pdf_bufs[salt_pos].id_buf[2];
281   id_buf[3] = pdf_bufs[salt_pos].id_buf[3];
282
283   u32 p0[4];
284   u32 p1[4];
285   u32 p2[4];
286   u32 p3[4];
287
288   p0[0] = padding[0];
289   p0[1] = padding[1];
290   p0[2] = padding[2];
291   p0[3] = padding[3];
292   p1[0] = padding[4];
293   p1[1] = padding[5];
294   p1[2] = padding[6];
295   p1[3] = padding[7];
296   p2[0] = 0;
297   p2[1] = 0;
298   p2[2] = 0;
299   p2[3] = 0;
300   p3[0] = 0;
301   p3[1] = 0;
302   p3[2] = 0;
303   p3[3] = 0;
304
305   switch_buffer_by_offset_le (p0, p1, p2, p3, pw_len);
306
307   w0[0] |= p0[0];
308   w0[1] |= p0[1];
309   w0[2] |= p0[2];
310   w0[3] |= p0[3];
311   w1[0] |= p1[0];
312   w1[1] |= p1[1];
313   w1[2] |= p1[2];
314   w1[3] |= p1[3];
315   w2[0] |= p2[0];
316   w2[1] |= p2[1];
317   w2[2] |= p2[2];
318   w2[3] |= p2[3];
319   w3[0] |= p3[0];
320   w3[1] |= p3[1];
321   w3[2] |= p3[2];
322   w3[3] |= p3[3];
323
324   /**
325    * loop
326    */
327
328   u32 w0l = w0[0];
329
330   for (u32 il_pos = 0; il_pos < il_cnt; il_pos++)
331   {
332     const u32 w0r = ix_create_bft (bfs_buf, il_pos);
333
334     w0[0] = w0l | w0r;
335
336     /**
337      * pdf
338      */
339
340     u32 w0_t[4];
341     u32 w1_t[4];
342     u32 w2_t[4];
343     u32 w3_t[4];
344
345     // add password
346     // truncate at 32 is wanted, not a bug!
347     // add o_buf
348
349     w0_t[0] = w0[0];
350     w0_t[1] = w0[1];
351     w0_t[2] = w0[2];
352     w0_t[3] = w0[3];
353     w1_t[0] = w1[0];
354     w1_t[1] = w1[1];
355     w1_t[2] = w1[2];
356     w1_t[3] = w1[3];
357     w2_t[0] = o_buf[0];
358     w2_t[1] = o_buf[1];
359     w2_t[2] = o_buf[2];
360     w2_t[3] = o_buf[3];
361     w3_t[0] = o_buf[4];
362     w3_t[1] = o_buf[5];
363     w3_t[2] = o_buf[6];
364     w3_t[3] = o_buf[7];
365
366     u32 digest[4];
367
368     digest[0] = MD5M_A;
369     digest[1] = MD5M_B;
370     digest[2] = MD5M_C;
371     digest[3] = MD5M_D;
372
373     md5_transform (w0_t, w1_t, w2_t, w3_t, digest);
374
375     w0_t[0] = P;
376     w0_t[1] = id_buf[0];
377     w0_t[2] = id_buf[1];
378     w0_t[3] = id_buf[2];
379     w1_t[0] = id_buf[3];
380     w1_t[1] = 0x80;
381     w1_t[2] = 0;
382     w1_t[3] = 0;
383     w2_t[0] = 0;
384     w2_t[1] = 0;
385     w2_t[2] = 0;
386     w2_t[3] = 0;
387     w3_t[0] = 0;
388     w3_t[1] = 0;
389     w3_t[2] = 84 * 8;
390     w3_t[3] = 0;
391
392     md5_transform (w0_t, w1_t, w2_t, w3_t, digest);
393
394     // now the RC4 part
395
396     digest[1] = digest[1] & 0xff;
397     digest[2] = 0;
398     digest[3] = 0;
399
400     rc4_init_16 (rc4_key, digest);
401
402     u32 out[4];
403
404     rc4_next_16 (rc4_key, 0, 0, padding, out);
405
406     COMPARE_M_SIMD (out[0], out[1], out[2], out[3]);
407   }
408 }
409
410 void m10400s (__local RC4_KEY *rc4_keys, u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset)
411 {
412   /**
413    * modifier
414    */
415
416   const u32 gid = get_global_id (0);
417   const u32 lid = get_local_id (0);
418
419   /**
420    * shared
421    */
422
423   __local RC4_KEY *rc4_key = &rc4_keys[lid];
424
425   /**
426    * U_buf
427    */
428
429   u32 o_buf[8];
430
431   o_buf[0] = pdf_bufs[salt_pos].o_buf[0];
432   o_buf[1] = pdf_bufs[salt_pos].o_buf[1];
433   o_buf[2] = pdf_bufs[salt_pos].o_buf[2];
434   o_buf[3] = pdf_bufs[salt_pos].o_buf[3];
435   o_buf[4] = pdf_bufs[salt_pos].o_buf[4];
436   o_buf[5] = pdf_bufs[salt_pos].o_buf[5];
437   o_buf[6] = pdf_bufs[salt_pos].o_buf[6];
438   o_buf[7] = pdf_bufs[salt_pos].o_buf[7];
439
440   u32 P = pdf_bufs[salt_pos].P;
441
442   u32 id_buf[4];
443
444   id_buf[0] = pdf_bufs[salt_pos].id_buf[0];
445   id_buf[1] = pdf_bufs[salt_pos].id_buf[1];
446   id_buf[2] = pdf_bufs[salt_pos].id_buf[2];
447   id_buf[3] = pdf_bufs[salt_pos].id_buf[3];
448
449   u32 p0[4];
450   u32 p1[4];
451   u32 p2[4];
452   u32 p3[4];
453
454   p0[0] = padding[0];
455   p0[1] = padding[1];
456   p0[2] = padding[2];
457   p0[3] = padding[3];
458   p1[0] = padding[4];
459   p1[1] = padding[5];
460   p1[2] = padding[6];
461   p1[3] = padding[7];
462   p2[0] = 0;
463   p2[1] = 0;
464   p2[2] = 0;
465   p2[3] = 0;
466   p3[0] = 0;
467   p3[1] = 0;
468   p3[2] = 0;
469   p3[3] = 0;
470
471   switch_buffer_by_offset_le (p0, p1, p2, p3, pw_len);
472
473   w0[0] |= p0[0];
474   w0[1] |= p0[1];
475   w0[2] |= p0[2];
476   w0[3] |= p0[3];
477   w1[0] |= p1[0];
478   w1[1] |= p1[1];
479   w1[2] |= p1[2];
480   w1[3] |= p1[3];
481   w2[0] |= p2[0];
482   w2[1] |= p2[1];
483   w2[2] |= p2[2];
484   w2[3] |= p2[3];
485   w3[0] |= p3[0];
486   w3[1] |= p3[1];
487   w3[2] |= p3[2];
488   w3[3] |= p3[3];
489
490   /**
491    * digest
492    */
493
494   const u32 search[4] =
495   {
496     digests_buf[digests_offset].digest_buf[DGST_R0],
497     digests_buf[digests_offset].digest_buf[DGST_R1],
498     digests_buf[digests_offset].digest_buf[DGST_R2],
499     digests_buf[digests_offset].digest_buf[DGST_R3]
500   };
501
502   /**
503    * loop
504    */
505
506   u32 w0l = w0[0];
507
508   for (u32 il_pos = 0; il_pos < il_cnt; il_pos++)
509   {
510     const u32 w0r = ix_create_bft (bfs_buf, il_pos);
511
512     w0[0] = w0l | w0r;
513
514     /**
515      * pdf
516      */
517
518     u32 w0_t[4];
519     u32 w1_t[4];
520     u32 w2_t[4];
521     u32 w3_t[4];
522
523     // add password
524     // truncate at 32 is wanted, not a bug!
525     // add o_buf
526
527     w0_t[0] = w0[0];
528     w0_t[1] = w0[1];
529     w0_t[2] = w0[2];
530     w0_t[3] = w0[3];
531     w1_t[0] = w1[0];
532     w1_t[1] = w1[1];
533     w1_t[2] = w1[2];
534     w1_t[3] = w1[3];
535     w2_t[0] = o_buf[0];
536     w2_t[1] = o_buf[1];
537     w2_t[2] = o_buf[2];
538     w2_t[3] = o_buf[3];
539     w3_t[0] = o_buf[4];
540     w3_t[1] = o_buf[5];
541     w3_t[2] = o_buf[6];
542     w3_t[3] = o_buf[7];
543
544     u32 digest[4];
545
546     digest[0] = MD5M_A;
547     digest[1] = MD5M_B;
548     digest[2] = MD5M_C;
549     digest[3] = MD5M_D;
550
551     md5_transform (w0_t, w1_t, w2_t, w3_t, digest);
552
553     w0_t[0] = P;
554     w0_t[1] = id_buf[0];
555     w0_t[2] = id_buf[1];
556     w0_t[3] = id_buf[2];
557     w1_t[0] = id_buf[3];
558     w1_t[1] = 0x80;
559     w1_t[2] = 0;
560     w1_t[3] = 0;
561     w2_t[0] = 0;
562     w2_t[1] = 0;
563     w2_t[2] = 0;
564     w2_t[3] = 0;
565     w3_t[0] = 0;
566     w3_t[1] = 0;
567     w3_t[2] = 84 * 8;
568     w3_t[3] = 0;
569
570     md5_transform (w0_t, w1_t, w2_t, w3_t, digest);
571
572     // now the RC4 part
573
574     digest[1] = digest[1] & 0xff;
575     digest[2] = 0;
576     digest[3] = 0;
577
578     rc4_init_16 (rc4_key, digest);
579
580     u32 out[4];
581
582     rc4_next_16 (rc4_key, 0, 0, padding, out);
583
584     COMPARE_S_SIMD (out[0], out[1], out[2], out[3]);
585   }
586 }
587
588 __kernel void m10400_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
589 {
590   /**
591    * base
592    */
593
594   const u32 gid = get_global_id (0);
595
596   if (gid >= gid_max) return;
597
598   u32 w0[4];
599
600   w0[0] = pws[gid].i[ 0];
601   w0[1] = pws[gid].i[ 1];
602   w0[2] = pws[gid].i[ 2];
603   w0[3] = pws[gid].i[ 3];
604
605   u32 w1[4];
606
607   w1[0] = 0;
608   w1[1] = 0;
609   w1[2] = 0;
610   w1[3] = 0;
611
612   u32 w2[4];
613
614   w2[0] = 0;
615   w2[1] = 0;
616   w2[2] = 0;
617   w2[3] = 0;
618
619   u32 w3[4];
620
621   w3[0] = 0;
622   w3[1] = 0;
623   w3[2] = 0;
624   w3[3] = 0;
625
626   const u32 pw_len = pws[gid].pw_len;
627
628   /**
629    * main
630    */
631
632   __local RC4_KEY rc4_keys[64];
633
634   m10400m (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
635 }
636
637 __kernel void m10400_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
638 {
639   /**
640    * base
641    */
642
643   const u32 gid = get_global_id (0);
644
645   if (gid >= gid_max) return;
646
647   u32 w0[4];
648
649   w0[0] = pws[gid].i[ 0];
650   w0[1] = pws[gid].i[ 1];
651   w0[2] = pws[gid].i[ 2];
652   w0[3] = pws[gid].i[ 3];
653
654   u32 w1[4];
655
656   w1[0] = pws[gid].i[ 4];
657   w1[1] = pws[gid].i[ 5];
658   w1[2] = pws[gid].i[ 6];
659   w1[3] = pws[gid].i[ 7];
660
661   u32 w2[4];
662
663   w2[0] = 0;
664   w2[1] = 0;
665   w2[2] = 0;
666   w2[3] = 0;
667
668   u32 w3[4];
669
670   w3[0] = 0;
671   w3[1] = 0;
672   w3[2] = 0;
673   w3[3] = 0;
674
675   const u32 pw_len = pws[gid].pw_len;
676
677   /**
678    * main
679    */
680
681   __local RC4_KEY rc4_keys[64];
682
683   m10400m (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
684 }
685
686 __kernel void m10400_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
687 {
688   /**
689    * base
690    */
691
692   const u32 gid = get_global_id (0);
693
694   if (gid >= gid_max) return;
695
696   u32 w0[4];
697
698   w0[0] = pws[gid].i[ 0];
699   w0[1] = pws[gid].i[ 1];
700   w0[2] = pws[gid].i[ 2];
701   w0[3] = pws[gid].i[ 3];
702
703   u32 w1[4];
704
705   w1[0] = pws[gid].i[ 4];
706   w1[1] = pws[gid].i[ 5];
707   w1[2] = pws[gid].i[ 6];
708   w1[3] = pws[gid].i[ 7];
709
710   u32 w2[4];
711
712   w2[0] = pws[gid].i[ 8];
713   w2[1] = pws[gid].i[ 9];
714   w2[2] = pws[gid].i[10];
715   w2[3] = pws[gid].i[11];
716
717   u32 w3[4];
718
719   w3[0] = pws[gid].i[12];
720   w3[1] = pws[gid].i[13];
721   w3[2] = 0;
722   w3[3] = 0;
723
724   const u32 pw_len = pws[gid].pw_len;
725
726   /**
727    * main
728    */
729
730   __local RC4_KEY rc4_keys[64];
731
732   m10400m (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
733 }
734
735 __kernel void m10400_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
736 {
737   /**
738    * base
739    */
740
741   const u32 gid = get_global_id (0);
742
743   if (gid >= gid_max) return;
744
745   u32 w0[4];
746
747   w0[0] = pws[gid].i[ 0];
748   w0[1] = pws[gid].i[ 1];
749   w0[2] = pws[gid].i[ 2];
750   w0[3] = pws[gid].i[ 3];
751
752   u32 w1[4];
753
754   w1[0] = 0;
755   w1[1] = 0;
756   w1[2] = 0;
757   w1[3] = 0;
758
759   u32 w2[4];
760
761   w2[0] = 0;
762   w2[1] = 0;
763   w2[2] = 0;
764   w2[3] = 0;
765
766   u32 w3[4];
767
768   w3[0] = 0;
769   w3[1] = 0;
770   w3[2] = 0;
771   w3[3] = 0;
772
773   const u32 pw_len = pws[gid].pw_len;
774
775   /**
776    * main
777    */
778
779   __local RC4_KEY rc4_keys[64];
780
781   m10400s (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
782 }
783
784 __kernel void m10400_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
785 {
786   /**
787    * base
788    */
789
790   const u32 gid = get_global_id (0);
791
792   if (gid >= gid_max) return;
793
794   u32 w0[4];
795
796   w0[0] = pws[gid].i[ 0];
797   w0[1] = pws[gid].i[ 1];
798   w0[2] = pws[gid].i[ 2];
799   w0[3] = pws[gid].i[ 3];
800
801   u32 w1[4];
802
803   w1[0] = pws[gid].i[ 4];
804   w1[1] = pws[gid].i[ 5];
805   w1[2] = pws[gid].i[ 6];
806   w1[3] = pws[gid].i[ 7];
807
808   u32 w2[4];
809
810   w2[0] = 0;
811   w2[1] = 0;
812   w2[2] = 0;
813   w2[3] = 0;
814
815   u32 w3[4];
816
817   w3[0] = 0;
818   w3[1] = 0;
819   w3[2] = 0;
820   w3[3] = 0;
821
822   const u32 pw_len = pws[gid].pw_len;
823
824   /**
825    * main
826    */
827
828   __local RC4_KEY rc4_keys[64];
829
830   m10400s (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
831 }
832
833 __kernel void m10400_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
834 {
835   /**
836    * base
837    */
838
839   const u32 gid = get_global_id (0);
840
841   if (gid >= gid_max) return;
842
843   u32 w0[4];
844
845   w0[0] = pws[gid].i[ 0];
846   w0[1] = pws[gid].i[ 1];
847   w0[2] = pws[gid].i[ 2];
848   w0[3] = pws[gid].i[ 3];
849
850   u32 w1[4];
851
852   w1[0] = pws[gid].i[ 4];
853   w1[1] = pws[gid].i[ 5];
854   w1[2] = pws[gid].i[ 6];
855   w1[3] = pws[gid].i[ 7];
856
857   u32 w2[4];
858
859   w2[0] = pws[gid].i[ 8];
860   w2[1] = pws[gid].i[ 9];
861   w2[2] = pws[gid].i[10];
862   w2[3] = pws[gid].i[11];
863
864   u32 w3[4];
865
866   w3[0] = pws[gid].i[12];
867   w3[1] = pws[gid].i[13];
868   w3[2] = 0;
869   w3[3] = 0;
870
871   const u32 pw_len = pws[gid].pw_len;
872
873   /**
874    * main
875    */
876
877   __local RC4_KEY rc4_keys[64];
878
879   m10400s (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
880 }