Initial commit
[hashcat.git] / amd / m10410_a3.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #include "include/constants.h"
9 #include "include/kernel_vendor.h"
10
11 #ifdef  VLIW1
12 #define VECT_SIZE1
13 #endif
14
15 #ifdef  VLIW4
16 #define VECT_SIZE1
17 #endif
18
19 #ifdef  VLIW5
20 #define VECT_SIZE1
21 #endif
22
23 #define DGST_R0 0
24 #define DGST_R1 1
25 #define DGST_R2 2
26 #define DGST_R3 3
27
28 #include "include/kernel_functions.c"
29 #include "types_amd.c"
30 #include "common_amd.c"
31
32 #ifdef  VECT_SIZE1
33 #define VECT_COMPARE_S "check_single_vect1_comp4.c"
34 #define VECT_COMPARE_M "check_multi_vect1_comp4.c"
35 #endif
36
37 #ifdef  VECT_SIZE4
38 #define VECT_COMPARE_S "check_single_vect4_comp4.c"
39 #define VECT_COMPARE_M "check_multi_vect4_comp4.c"
40 #endif
41
42 __constant u32 padding[8] =
43 {
44   0x5e4ebf28,
45   0x418a754e,
46   0x564e0064,
47   0x0801faff,
48   0xb6002e2e,
49   0x803e68d0,
50   0xfea90c2f,
51   0x7a695364
52 };
53
54 typedef struct
55 {
56   u8 S[256];
57
58   u32 wtf_its_faster;
59
60 } RC4_KEY;
61
62 static void swap (__local RC4_KEY *rc4_key, const u8 i, const u8 j)
63 {
64   u8 tmp;
65
66   tmp           = rc4_key->S[i];
67   rc4_key->S[i] = rc4_key->S[j];
68   rc4_key->S[j] = tmp;
69 }
70
71 static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
72 {
73   u32 v = 0x03020100;
74   u32 a = 0x04040404;
75
76   __local u32 *ptr = (__local u32 *) rc4_key->S;
77
78   #pragma unroll
79   for (u32 i = 0; i < 64; i++)
80   {
81     ptr[i] = v; v += a;
82   }
83
84   const u32 d0 = data[0] >>  0;
85   const u32 d1 = data[0] >>  8;
86   const u32 d2 = data[0] >> 16;
87   const u32 d3 = data[0] >> 24;
88   const u32 d4 = data[1] >>  0;
89
90   u32 j = 0;
91
92   #pragma unroll
93   for (u32 i = 0; i < 255; i += 5)
94   {
95     j += rc4_key->S[i + 0] + d0; swap (rc4_key, i + 0, j);
96     j += rc4_key->S[i + 1] + d1; swap (rc4_key, i + 1, j);
97     j += rc4_key->S[i + 2] + d2; swap (rc4_key, i + 2, j);
98     j += rc4_key->S[i + 3] + d3; swap (rc4_key, i + 3, j);
99     j += rc4_key->S[i + 4] + d4; swap (rc4_key, i + 4, j);
100   }
101
102   j += rc4_key->S[255] + d0; swap (rc4_key, 255, j);
103 }
104
105 static u8 rc4_next_16 (__local RC4_KEY *rc4_key, u8 i, u8 j, __constant u32 in[4], u32 out[4])
106 {
107   for (u32 k = 0; k < 4; k++)
108   {
109     u32 xor4 = 0;
110
111     u8 idx;
112
113     i += 1;
114     j += rc4_key->S[i];
115
116     swap (rc4_key, i, j);
117
118     idx = rc4_key->S[i] + rc4_key->S[j];
119
120     xor4 |= rc4_key->S[idx] <<  0;
121
122     i += 1;
123     j += rc4_key->S[i];
124
125     swap (rc4_key, i, j);
126
127     idx = rc4_key->S[i] + rc4_key->S[j];
128
129     xor4 |= rc4_key->S[idx] <<  8;
130
131     i += 1;
132     j += rc4_key->S[i];
133
134     swap (rc4_key, i, j);
135
136     idx = rc4_key->S[i] + rc4_key->S[j];
137
138     xor4 |= rc4_key->S[idx] << 16;
139
140     i += 1;
141     j += rc4_key->S[i];
142
143     swap (rc4_key, i, j);
144
145     idx = rc4_key->S[i] + rc4_key->S[j];
146
147     xor4 |= rc4_key->S[idx] << 24;
148
149     out[k] = in[k] ^ xor4;
150   }
151
152   return j;
153 }
154
155 static void m10410m (__local RC4_KEY rc4_keys[64], u32x w0[4], u32x w1[4], u32x w2[4], u32x w3[4], const u32 pw_len, __global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset)
156 {
157   /**
158    * modifier
159    */
160
161   const u32 gid = get_global_id (0);
162   const u32 lid = get_local_id (0);
163
164   __local RC4_KEY *rc4_key = &rc4_keys[lid];
165
166   /**
167    * loop
168    */
169
170   u32x w0l = w0[0];
171
172   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos++)
173   {
174     const u32 w0r = bfs_buf[il_pos].i;
175
176     w0[0] = w0l | w0r;
177
178     // now the RC4 part
179
180     u32x key[4];
181
182     key[0] = w0[0];
183     key[1] = w0[1];
184     key[2] = 0;
185     key[3] = 0;
186
187     rc4_init_16 (rc4_key, key);
188
189     u32x out[4];
190
191     rc4_next_16 (rc4_key, 0, 0, padding, out);
192
193     const u32x r0 = out[0];
194     const u32x r1 = out[1];
195     const u32x r2 = out[2];
196     const u32x r3 = out[3];
197
198     #include VECT_COMPARE_M
199   }
200 }
201
202 static void m10410s (__local RC4_KEY rc4_keys[64], u32x w0[4], u32x w1[4], u32x w2[4], u32x w3[4], const u32 pw_len, __global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset)
203 {
204   /**
205    * modifier
206    */
207
208   const u32 gid = get_global_id (0);
209   const u32 lid = get_local_id (0);
210
211   __local RC4_KEY *rc4_key = &rc4_keys[lid];
212
213   /**
214    * digest
215    */
216
217   const u32 search[4] =
218   {
219     digests_buf[digests_offset].digest_buf[DGST_R0],
220     digests_buf[digests_offset].digest_buf[DGST_R1],
221     digests_buf[digests_offset].digest_buf[DGST_R2],
222     digests_buf[digests_offset].digest_buf[DGST_R3]
223   };
224
225   /**
226    * loop
227    */
228
229   u32x w0l = w0[0];
230
231   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos++)
232   {
233     const u32 w0r = bfs_buf[il_pos].i;
234
235     w0[0] = w0l | w0r;
236
237     // now the RC4 part
238
239     u32x key[4];
240
241     key[0] = w0[0];
242     key[1] = w0[1];
243     key[2] = 0;
244     key[3] = 0;
245
246     rc4_init_16 (rc4_key, key);
247
248     u32x out[4];
249
250     rc4_next_16 (rc4_key, 0, 0, padding, out);
251
252     const u32x r0 = out[0];
253     const u32x r1 = out[1];
254     const u32x r2 = out[2];
255     const u32x r3 = out[3];
256
257     #include VECT_COMPARE_S
258   }
259 }
260
261 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m10410_m04 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
262 {
263   /**
264    * base
265    */
266
267   const u32 gid = get_global_id (0);
268
269   if (gid >= gid_max) return;
270
271   u32x w0[4];
272
273   w0[0] = pws[gid].i[ 0];
274   w0[1] = pws[gid].i[ 1];
275   w0[2] = pws[gid].i[ 2];
276   w0[3] = pws[gid].i[ 3];
277
278   u32x w1[4];
279
280   w1[0] = 0;
281   w1[1] = 0;
282   w1[2] = 0;
283   w1[3] = 0;
284
285   u32x w2[4];
286
287   w2[0] = 0;
288   w2[1] = 0;
289   w2[2] = 0;
290   w2[3] = 0;
291
292   u32x w3[4];
293
294   w3[0] = 0;
295   w3[1] = 0;
296   w3[2] = 0;
297   w3[3] = 0;
298
299   const u32 pw_len = pws[gid].pw_len;
300
301   /**
302    * main
303    */
304
305   __local RC4_KEY rc4_keys[64];
306
307   m10410m (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
308 }
309
310 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m10410_m08 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
311 {
312   /**
313    * base
314    */
315
316   const u32 gid = get_global_id (0);
317
318   if (gid >= gid_max) return;
319
320   u32x w0[4];
321
322   w0[0] = pws[gid].i[ 0];
323   w0[1] = pws[gid].i[ 1];
324   w0[2] = pws[gid].i[ 2];
325   w0[3] = pws[gid].i[ 3];
326
327   u32x w1[4];
328
329   w1[0] = pws[gid].i[ 4];
330   w1[1] = pws[gid].i[ 5];
331   w1[2] = pws[gid].i[ 6];
332   w1[3] = pws[gid].i[ 7];
333
334   u32x w2[4];
335
336   w2[0] = 0;
337   w2[1] = 0;
338   w2[2] = 0;
339   w2[3] = 0;
340
341   u32x w3[4];
342
343   w3[0] = 0;
344   w3[1] = 0;
345   w3[2] = 0;
346   w3[3] = 0;
347
348   const u32 pw_len = pws[gid].pw_len;
349
350   /**
351    * main
352    */
353
354   __local RC4_KEY rc4_keys[64];
355
356   m10410m (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
357 }
358
359 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m10410_m16 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
360 {
361   /**
362    * base
363    */
364
365   const u32 gid = get_global_id (0);
366
367   if (gid >= gid_max) return;
368
369   u32x w0[4];
370
371   w0[0] = pws[gid].i[ 0];
372   w0[1] = pws[gid].i[ 1];
373   w0[2] = pws[gid].i[ 2];
374   w0[3] = pws[gid].i[ 3];
375
376   u32x w1[4];
377
378   w1[0] = pws[gid].i[ 4];
379   w1[1] = pws[gid].i[ 5];
380   w1[2] = pws[gid].i[ 6];
381   w1[3] = pws[gid].i[ 7];
382
383   u32x w2[4];
384
385   w2[0] = pws[gid].i[ 8];
386   w2[1] = pws[gid].i[ 9];
387   w2[2] = pws[gid].i[10];
388   w2[3] = pws[gid].i[11];
389
390   u32x w3[4];
391
392   w3[0] = pws[gid].i[12];
393   w3[1] = pws[gid].i[13];
394   w3[2] = 0;
395   w3[3] = 0;
396
397   const u32 pw_len = pws[gid].pw_len;
398
399   /**
400    * main
401    */
402
403   __local RC4_KEY rc4_keys[64];
404
405   m10410m (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
406 }
407
408 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m10410_s04 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
409 {
410   /**
411    * base
412    */
413
414   const u32 gid = get_global_id (0);
415
416   if (gid >= gid_max) return;
417
418   u32x w0[4];
419
420   w0[0] = pws[gid].i[ 0];
421   w0[1] = pws[gid].i[ 1];
422   w0[2] = pws[gid].i[ 2];
423   w0[3] = pws[gid].i[ 3];
424
425   u32x w1[4];
426
427   w1[0] = 0;
428   w1[1] = 0;
429   w1[2] = 0;
430   w1[3] = 0;
431
432   u32x w2[4];
433
434   w2[0] = 0;
435   w2[1] = 0;
436   w2[2] = 0;
437   w2[3] = 0;
438
439   u32x w3[4];
440
441   w3[0] = 0;
442   w3[1] = 0;
443   w3[2] = 0;
444   w3[3] = 0;
445
446   const u32 pw_len = pws[gid].pw_len;
447
448   /**
449    * main
450    */
451
452   __local RC4_KEY rc4_keys[64];
453
454   m10410s (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
455 }
456
457 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m10410_s08 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
458 {
459   /**
460    * base
461    */
462
463   const u32 gid = get_global_id (0);
464
465   if (gid >= gid_max) return;
466
467   u32x w0[4];
468
469   w0[0] = pws[gid].i[ 0];
470   w0[1] = pws[gid].i[ 1];
471   w0[2] = pws[gid].i[ 2];
472   w0[3] = pws[gid].i[ 3];
473
474   u32x w1[4];
475
476   w1[0] = pws[gid].i[ 4];
477   w1[1] = pws[gid].i[ 5];
478   w1[2] = pws[gid].i[ 6];
479   w1[3] = pws[gid].i[ 7];
480
481   u32x w2[4];
482
483   w2[0] = 0;
484   w2[1] = 0;
485   w2[2] = 0;
486   w2[3] = 0;
487
488   u32x w3[4];
489
490   w3[0] = 0;
491   w3[1] = 0;
492   w3[2] = 0;
493   w3[3] = 0;
494
495   const u32 pw_len = pws[gid].pw_len;
496
497   /**
498    * main
499    */
500
501   __local RC4_KEY rc4_keys[64];
502
503   m10410s (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
504 }
505
506 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m10410_s16 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
507 {
508   /**
509    * base
510    */
511
512   const u32 gid = get_global_id (0);
513
514   if (gid >= gid_max) return;
515
516   u32x w0[4];
517
518   w0[0] = pws[gid].i[ 0];
519   w0[1] = pws[gid].i[ 1];
520   w0[2] = pws[gid].i[ 2];
521   w0[3] = pws[gid].i[ 3];
522
523   u32x w1[4];
524
525   w1[0] = pws[gid].i[ 4];
526   w1[1] = pws[gid].i[ 5];
527   w1[2] = pws[gid].i[ 6];
528   w1[3] = pws[gid].i[ 7];
529
530   u32x w2[4];
531
532   w2[0] = pws[gid].i[ 8];
533   w2[1] = pws[gid].i[ 9];
534   w2[2] = pws[gid].i[10];
535   w2[3] = pws[gid].i[11];
536
537   u32x w3[4];
538
539   w3[0] = pws[gid].i[12];
540   w3[1] = pws[gid].i[13];
541   w3[2] = 0;
542   w3[3] = 0;
543
544   const u32 pw_len = pws[gid].pw_len;
545
546   /**
547    * main
548    */
549
550   __local RC4_KEY rc4_keys[64];
551
552   m10410s (rc4_keys, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, pdf_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
553 }