- Dropped all vector code since new GPU's are all scalar, makes the code much easier
[hashcat.git] / OpenCL / m02410_a0.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #include "include/constants.h"
9 #include "include/kernel_vendor.h"
10
11 #define DGST_R0 0
12 #define DGST_R1 3
13 #define DGST_R2 2
14 #define DGST_R3 1
15
16 #include "include/kernel_functions.c"
17 #include "types_ocl.c"
18 #include "common.c"
19 #include "include/rp_gpu.h"
20 #include "rp.c"
21
22 #define COMPARE_S "check_single_comp4.c"
23 #define COMPARE_M "check_multi_comp4.c"
24
25 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m02410_m04 (__global pw_t *pws, __global gpu_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
26 {
27   /**
28    * modifier
29    */
30
31   const u32 lid = get_local_id (0);
32
33   /**
34    * base
35    */
36
37   const u32 gid = get_global_id (0);
38
39   if (gid >= gid_max) return;
40
41   u32 pw_buf0[4];
42
43   pw_buf0[0] = pws[gid].i[ 0];
44   pw_buf0[1] = pws[gid].i[ 1];
45   pw_buf0[2] = pws[gid].i[ 2];
46   pw_buf0[3] = pws[gid].i[ 3];
47
48   const u32 pw_len = pws[gid].pw_len;
49
50   /**
51    * salt
52    */
53
54   u32 salt_buf0[4];
55
56   salt_buf0[0] = salt_bufs[salt_pos].salt_buf[0];
57   salt_buf0[1] = 0;
58   salt_buf0[2] = 0;
59   salt_buf0[3] = 0;
60
61   const u32 salt_len = (salt_bufs[salt_pos].salt_len < 4) ? salt_bufs[salt_pos].salt_len : 4;
62
63   /**
64    * loop
65    */
66
67   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
68   {
69     u32 w0[4];
70
71     w0[0] = pw_buf0[0];
72     w0[1] = pw_buf0[1];
73     w0[2] = pw_buf0[2];
74     w0[3] = pw_buf0[3];
75
76     u32 w1[4];
77
78     w1[0] = 0;
79     w1[1] = 0;
80     w1[2] = 0;
81     w1[3] = 0;
82
83     u32 w2[4];
84
85     w2[0] = 0;
86     w2[1] = 0;
87     w2[2] = 0;
88     w2[3] = 0;
89
90     u32 w3[4];
91
92     w3[0] = 0;
93     w3[1] = 0;
94     w3[2] = 0;
95     w3[3] = 0;
96
97     const u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
98
99     /**
100      * append salt
101      */
102
103     u32 s0[4];
104
105     s0[0] = salt_buf0[0];
106     s0[1] = salt_buf0[1];
107     s0[2] = salt_buf0[2];
108     s0[3] = salt_buf0[3];
109
110     u32 s1[4];
111
112     s1[0] = 0;
113     s1[1] = 0;
114     s1[2] = 0;
115     s1[3] = 0;
116
117     u32 s2[4];
118
119     s2[0] = 0;
120     s2[1] = 0;
121     s2[2] = 0;
122     s2[3] = 0;
123
124     u32 s3[4];
125
126     s3[0] = 0;
127     s3[1] = 0;
128     s3[2] = 0;
129     s3[3] = 0;
130
131     switch_buffer_by_offset (s0, s1, s2, s3, out_len);
132
133     w0[0] |= s0[0];
134     w0[1] |= s0[1];
135     w0[2] |= s0[2];
136     w0[3] |= s0[3];
137
138     const u32 pw_salt_len = out_len + salt_len;
139
140     truncate_block (w0, pw_salt_len);
141
142     w1[0] = 0x80;
143     w3[2] = 16 * 8;
144
145     u32 tmp2;
146
147     u32 a = MD5M_A;
148     u32 b = MD5M_B;
149     u32 c = MD5M_C;
150     u32 d = MD5M_D;
151
152     MD5_STEP (MD5_Fo, a, b, c, d, w0[0], MD5C00, MD5S00);
153     MD5_STEP (MD5_Fo, d, a, b, c, w0[1], MD5C01, MD5S01);
154     MD5_STEP (MD5_Fo, c, d, a, b, w0[2], MD5C02, MD5S02);
155     MD5_STEP (MD5_Fo, b, c, d, a, w0[3], MD5C03, MD5S03);
156     MD5_STEP (MD5_Fo, a, b, c, d, w1[0], MD5C04, MD5S00);
157     MD5_STEP (MD5_Fo, d, a, b, c, w1[1], MD5C05, MD5S01);
158     MD5_STEP (MD5_Fo, c, d, a, b, w1[2], MD5C06, MD5S02);
159     MD5_STEP (MD5_Fo, b, c, d, a, w1[3], MD5C07, MD5S03);
160     MD5_STEP (MD5_Fo, a, b, c, d, w2[0], MD5C08, MD5S00);
161     MD5_STEP (MD5_Fo, d, a, b, c, w2[1], MD5C09, MD5S01);
162     MD5_STEP (MD5_Fo, c, d, a, b, w2[2], MD5C0a, MD5S02);
163     MD5_STEP (MD5_Fo, b, c, d, a, w2[3], MD5C0b, MD5S03);
164     MD5_STEP (MD5_Fo, a, b, c, d, w3[0], MD5C0c, MD5S00);
165     MD5_STEP (MD5_Fo, d, a, b, c, w3[1], MD5C0d, MD5S01);
166     MD5_STEP (MD5_Fo, c, d, a, b, w3[2], MD5C0e, MD5S02);
167     MD5_STEP (MD5_Fo, b, c, d, a, w3[3], MD5C0f, MD5S03);
168
169     MD5_STEP (MD5_Go, a, b, c, d, w0[1], MD5C10, MD5S10);
170     MD5_STEP (MD5_Go, d, a, b, c, w1[2], MD5C11, MD5S11);
171     MD5_STEP (MD5_Go, c, d, a, b, w2[3], MD5C12, MD5S12);
172     MD5_STEP (MD5_Go, b, c, d, a, w0[0], MD5C13, MD5S13);
173     MD5_STEP (MD5_Go, a, b, c, d, w1[1], MD5C14, MD5S10);
174     MD5_STEP (MD5_Go, d, a, b, c, w2[2], MD5C15, MD5S11);
175     MD5_STEP (MD5_Go, c, d, a, b, w3[3], MD5C16, MD5S12);
176     MD5_STEP (MD5_Go, b, c, d, a, w1[0], MD5C17, MD5S13);
177     MD5_STEP (MD5_Go, a, b, c, d, w2[1], MD5C18, MD5S10);
178     MD5_STEP (MD5_Go, d, a, b, c, w3[2], MD5C19, MD5S11);
179     MD5_STEP (MD5_Go, c, d, a, b, w0[3], MD5C1a, MD5S12);
180     MD5_STEP (MD5_Go, b, c, d, a, w2[0], MD5C1b, MD5S13);
181     MD5_STEP (MD5_Go, a, b, c, d, w3[1], MD5C1c, MD5S10);
182     MD5_STEP (MD5_Go, d, a, b, c, w0[2], MD5C1d, MD5S11);
183     MD5_STEP (MD5_Go, c, d, a, b, w1[3], MD5C1e, MD5S12);
184     MD5_STEP (MD5_Go, b, c, d, a, w3[0], MD5C1f, MD5S13);
185
186     MD5_STEP (MD5_H1, a, b, c, d, w1[1], MD5C20, MD5S20);
187     MD5_STEP (MD5_H2, d, a, b, c, w2[0], MD5C21, MD5S21);
188     MD5_STEP (MD5_H1, c, d, a, b, w2[3], MD5C22, MD5S22);
189     MD5_STEP (MD5_H2, b, c, d, a, w3[2], MD5C23, MD5S23);
190     MD5_STEP (MD5_H1, a, b, c, d, w0[1], MD5C24, MD5S20);
191     MD5_STEP (MD5_H2, d, a, b, c, w1[0], MD5C25, MD5S21);
192     MD5_STEP (MD5_H1, c, d, a, b, w1[3], MD5C26, MD5S22);
193     MD5_STEP (MD5_H2, b, c, d, a, w2[2], MD5C27, MD5S23);
194     MD5_STEP (MD5_H1, a, b, c, d, w3[1], MD5C28, MD5S20);
195     MD5_STEP (MD5_H2, d, a, b, c, w0[0], MD5C29, MD5S21);
196     MD5_STEP (MD5_H1, c, d, a, b, w0[3], MD5C2a, MD5S22);
197     MD5_STEP (MD5_H2, b, c, d, a, w1[2], MD5C2b, MD5S23);
198     MD5_STEP (MD5_H1, a, b, c, d, w2[1], MD5C2c, MD5S20);
199     MD5_STEP (MD5_H2, d, a, b, c, w3[0], MD5C2d, MD5S21);
200     MD5_STEP (MD5_H1, c, d, a, b, w3[3], MD5C2e, MD5S22);
201     MD5_STEP (MD5_H2, b, c, d, a, w0[2], MD5C2f, MD5S23);
202
203     MD5_STEP (MD5_I , a, b, c, d, w0[0], MD5C30, MD5S30);
204     MD5_STEP (MD5_I , d, a, b, c, w1[3], MD5C31, MD5S31);
205     MD5_STEP (MD5_I , c, d, a, b, w3[2], MD5C32, MD5S32);
206     MD5_STEP (MD5_I , b, c, d, a, w1[1], MD5C33, MD5S33);
207     MD5_STEP (MD5_I , a, b, c, d, w3[0], MD5C34, MD5S30);
208     MD5_STEP (MD5_I , d, a, b, c, w0[3], MD5C35, MD5S31);
209     MD5_STEP (MD5_I , c, d, a, b, w2[2], MD5C36, MD5S32);
210     MD5_STEP (MD5_I , b, c, d, a, w0[1], MD5C37, MD5S33);
211     MD5_STEP (MD5_I , a, b, c, d, w2[0], MD5C38, MD5S30);
212     MD5_STEP (MD5_I , d, a, b, c, w3[3], MD5C39, MD5S31);
213     MD5_STEP (MD5_I , c, d, a, b, w1[2], MD5C3a, MD5S32);
214     MD5_STEP (MD5_I , b, c, d, a, w3[1], MD5C3b, MD5S33);
215     MD5_STEP (MD5_I , a, b, c, d, w1[0], MD5C3c, MD5S30);
216     MD5_STEP (MD5_I , d, a, b, c, w2[3], MD5C3d, MD5S31);
217     MD5_STEP (MD5_I , c, d, a, b, w0[2], MD5C3e, MD5S32);
218     MD5_STEP (MD5_I , b, c, d, a, w2[1], MD5C3f, MD5S33);
219
220     a &= 0x00ffffff;
221     d &= 0x00ffffff;
222     c &= 0x00ffffff;
223     b &= 0x00ffffff;
224
225     const u32 r0 = a;
226     const u32 r1 = d;
227     const u32 r2 = c;
228     const u32 r3 = b;
229
230     #include COMPARE_M
231   }
232 }
233
234 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m02410_m08 (__global pw_t *pws, __global gpu_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
235 {
236 }
237
238 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m02410_m16 (__global pw_t *pws, __global gpu_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
239 {
240 }
241
242 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m02410_s04 (__global pw_t *pws, __global gpu_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
243 {
244   /**
245    * modifier
246    */
247
248   const u32 lid = get_local_id (0);
249
250   /**
251    * base
252    */
253
254   const u32 gid = get_global_id (0);
255
256   if (gid >= gid_max) return;
257
258   u32 pw_buf0[4];
259
260   pw_buf0[0] = pws[gid].i[ 0];
261   pw_buf0[1] = pws[gid].i[ 1];
262   pw_buf0[2] = pws[gid].i[ 2];
263   pw_buf0[3] = pws[gid].i[ 3];
264
265   const u32 pw_len = pws[gid].pw_len;
266
267   /**
268    * salt
269    */
270
271   u32 salt_buf0[4];
272
273   salt_buf0[0] = salt_bufs[salt_pos].salt_buf[0];
274   salt_buf0[1] = 0;
275   salt_buf0[2] = 0;
276   salt_buf0[3] = 0;
277
278   const u32 salt_len = (salt_bufs[salt_pos].salt_len < 4) ? salt_bufs[salt_pos].salt_len : 4;
279
280   /**
281    * digest
282    */
283
284   const u32 search[4] =
285   {
286     digests_buf[digests_offset].digest_buf[DGST_R0],
287     digests_buf[digests_offset].digest_buf[DGST_R1],
288     digests_buf[digests_offset].digest_buf[DGST_R2],
289     digests_buf[digests_offset].digest_buf[DGST_R3]
290   };
291
292   /**
293    * loop
294    */
295
296   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
297   {
298     u32 w0[4];
299
300     w0[0] = pw_buf0[0];
301     w0[1] = pw_buf0[1];
302     w0[2] = pw_buf0[2];
303     w0[3] = pw_buf0[3];
304
305     u32 w1[4];
306
307     w1[0] = 0;
308     w1[1] = 0;
309     w1[2] = 0;
310     w1[3] = 0;
311
312     u32 w2[4];
313
314     w2[0] = 0;
315     w2[1] = 0;
316     w2[2] = 0;
317     w2[3] = 0;
318
319     u32 w3[4];
320
321     w3[0] = 0;
322     w3[1] = 0;
323     w3[2] = 0;
324     w3[3] = 0;
325
326     const u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
327
328     /**
329      * append salt
330      */
331
332     u32 s0[4];
333
334     s0[0] = salt_buf0[0];
335     s0[1] = salt_buf0[1];
336     s0[2] = salt_buf0[2];
337     s0[3] = salt_buf0[3];
338
339     u32 s1[4];
340
341     s1[0] = 0;
342     s1[1] = 0;
343     s1[2] = 0;
344     s1[3] = 0;
345
346     u32 s2[4];
347
348     s2[0] = 0;
349     s2[1] = 0;
350     s2[2] = 0;
351     s2[3] = 0;
352
353     u32 s3[4];
354
355     s3[0] = 0;
356     s3[1] = 0;
357     s3[2] = 0;
358     s3[3] = 0;
359
360     switch_buffer_by_offset (s0, s1, s2, s3, out_len);
361
362     w0[0] |= s0[0];
363     w0[1] |= s0[1];
364     w0[2] |= s0[2];
365     w0[3] |= s0[3];
366
367     const u32 pw_salt_len = out_len + salt_len;
368
369     truncate_block (w0, pw_salt_len);
370
371     w1[0] = 0x80;
372     w3[2] = 16 * 8;
373
374     u32 tmp2;
375
376     u32 a = MD5M_A;
377     u32 b = MD5M_B;
378     u32 c = MD5M_C;
379     u32 d = MD5M_D;
380
381     MD5_STEP (MD5_Fo, a, b, c, d, w0[0], MD5C00, MD5S00);
382     MD5_STEP (MD5_Fo, d, a, b, c, w0[1], MD5C01, MD5S01);
383     MD5_STEP (MD5_Fo, c, d, a, b, w0[2], MD5C02, MD5S02);
384     MD5_STEP (MD5_Fo, b, c, d, a, w0[3], MD5C03, MD5S03);
385     MD5_STEP (MD5_Fo, a, b, c, d, w1[0], MD5C04, MD5S00);
386     MD5_STEP (MD5_Fo, d, a, b, c, w1[1], MD5C05, MD5S01);
387     MD5_STEP (MD5_Fo, c, d, a, b, w1[2], MD5C06, MD5S02);
388     MD5_STEP (MD5_Fo, b, c, d, a, w1[3], MD5C07, MD5S03);
389     MD5_STEP (MD5_Fo, a, b, c, d, w2[0], MD5C08, MD5S00);
390     MD5_STEP (MD5_Fo, d, a, b, c, w2[1], MD5C09, MD5S01);
391     MD5_STEP (MD5_Fo, c, d, a, b, w2[2], MD5C0a, MD5S02);
392     MD5_STEP (MD5_Fo, b, c, d, a, w2[3], MD5C0b, MD5S03);
393     MD5_STEP (MD5_Fo, a, b, c, d, w3[0], MD5C0c, MD5S00);
394     MD5_STEP (MD5_Fo, d, a, b, c, w3[1], MD5C0d, MD5S01);
395     MD5_STEP (MD5_Fo, c, d, a, b, w3[2], MD5C0e, MD5S02);
396     MD5_STEP (MD5_Fo, b, c, d, a, w3[3], MD5C0f, MD5S03);
397
398     MD5_STEP (MD5_Go, a, b, c, d, w0[1], MD5C10, MD5S10);
399     MD5_STEP (MD5_Go, d, a, b, c, w1[2], MD5C11, MD5S11);
400     MD5_STEP (MD5_Go, c, d, a, b, w2[3], MD5C12, MD5S12);
401     MD5_STEP (MD5_Go, b, c, d, a, w0[0], MD5C13, MD5S13);
402     MD5_STEP (MD5_Go, a, b, c, d, w1[1], MD5C14, MD5S10);
403     MD5_STEP (MD5_Go, d, a, b, c, w2[2], MD5C15, MD5S11);
404     MD5_STEP (MD5_Go, c, d, a, b, w3[3], MD5C16, MD5S12);
405     MD5_STEP (MD5_Go, b, c, d, a, w1[0], MD5C17, MD5S13);
406     MD5_STEP (MD5_Go, a, b, c, d, w2[1], MD5C18, MD5S10);
407     MD5_STEP (MD5_Go, d, a, b, c, w3[2], MD5C19, MD5S11);
408     MD5_STEP (MD5_Go, c, d, a, b, w0[3], MD5C1a, MD5S12);
409     MD5_STEP (MD5_Go, b, c, d, a, w2[0], MD5C1b, MD5S13);
410     MD5_STEP (MD5_Go, a, b, c, d, w3[1], MD5C1c, MD5S10);
411     MD5_STEP (MD5_Go, d, a, b, c, w0[2], MD5C1d, MD5S11);
412     MD5_STEP (MD5_Go, c, d, a, b, w1[3], MD5C1e, MD5S12);
413     MD5_STEP (MD5_Go, b, c, d, a, w3[0], MD5C1f, MD5S13);
414
415     MD5_STEP (MD5_H1, a, b, c, d, w1[1], MD5C20, MD5S20);
416     MD5_STEP (MD5_H2, d, a, b, c, w2[0], MD5C21, MD5S21);
417     MD5_STEP (MD5_H1, c, d, a, b, w2[3], MD5C22, MD5S22);
418     MD5_STEP (MD5_H2, b, c, d, a, w3[2], MD5C23, MD5S23);
419     MD5_STEP (MD5_H1, a, b, c, d, w0[1], MD5C24, MD5S20);
420     MD5_STEP (MD5_H2, d, a, b, c, w1[0], MD5C25, MD5S21);
421     MD5_STEP (MD5_H1, c, d, a, b, w1[3], MD5C26, MD5S22);
422     MD5_STEP (MD5_H2, b, c, d, a, w2[2], MD5C27, MD5S23);
423     MD5_STEP (MD5_H1, a, b, c, d, w3[1], MD5C28, MD5S20);
424     MD5_STEP (MD5_H2, d, a, b, c, w0[0], MD5C29, MD5S21);
425     MD5_STEP (MD5_H1, c, d, a, b, w0[3], MD5C2a, MD5S22);
426     MD5_STEP (MD5_H2, b, c, d, a, w1[2], MD5C2b, MD5S23);
427     MD5_STEP (MD5_H1, a, b, c, d, w2[1], MD5C2c, MD5S20);
428     MD5_STEP (MD5_H2, d, a, b, c, w3[0], MD5C2d, MD5S21);
429     MD5_STEP (MD5_H1, c, d, a, b, w3[3], MD5C2e, MD5S22);
430     MD5_STEP (MD5_H2, b, c, d, a, w0[2], MD5C2f, MD5S23);
431
432     MD5_STEP (MD5_I , a, b, c, d, w0[0], MD5C30, MD5S30);
433     MD5_STEP (MD5_I , d, a, b, c, w1[3], MD5C31, MD5S31);
434     MD5_STEP (MD5_I , c, d, a, b, w3[2], MD5C32, MD5S32);
435     MD5_STEP (MD5_I , b, c, d, a, w1[1], MD5C33, MD5S33);
436     MD5_STEP (MD5_I , a, b, c, d, w3[0], MD5C34, MD5S30);
437     MD5_STEP (MD5_I , d, a, b, c, w0[3], MD5C35, MD5S31);
438     MD5_STEP (MD5_I , c, d, a, b, w2[2], MD5C36, MD5S32);
439     MD5_STEP (MD5_I , b, c, d, a, w0[1], MD5C37, MD5S33);
440     MD5_STEP (MD5_I , a, b, c, d, w2[0], MD5C38, MD5S30);
441     MD5_STEP (MD5_I , d, a, b, c, w3[3], MD5C39, MD5S31);
442     MD5_STEP (MD5_I , c, d, a, b, w1[2], MD5C3a, MD5S32);
443     MD5_STEP (MD5_I , b, c, d, a, w3[1], MD5C3b, MD5S33);
444     MD5_STEP (MD5_I , a, b, c, d, w1[0], MD5C3c, MD5S30);
445
446     bool q_cond = allx ((a & 0x00ffffff) != search[0]);
447
448     if (q_cond) continue;
449
450     MD5_STEP (MD5_I , d, a, b, c, w2[3], MD5C3d, MD5S31);
451     MD5_STEP (MD5_I , c, d, a, b, w0[2], MD5C3e, MD5S32);
452     MD5_STEP (MD5_I , b, c, d, a, w2[1], MD5C3f, MD5S33);
453
454     a &= 0x00ffffff;
455     d &= 0x00ffffff;
456     c &= 0x00ffffff;
457     b &= 0x00ffffff;
458
459     const u32 r0 = a;
460     const u32 r1 = d;
461     const u32 r2 = c;
462     const u32 r3 = b;
463
464     #include COMPARE_S
465   }
466 }
467
468 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m02410_s08 (__global pw_t *pws, __global gpu_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
469 {
470 }
471
472 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m02410_s16 (__global pw_t *pws, __global gpu_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
473 {
474 }