Prepare new SIMD code for kernel, -m 0, 10, 20, 1000 should work in -a 3 mode and...
[hashcat.git] / OpenCL / m00020_a3.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #define NEW_SIMD_CODE
9
10 #include "include/constants.h"
11 #include "include/kernel_vendor.h"
12
13 #define DGST_R0 0
14 #define DGST_R1 3
15 #define DGST_R2 2
16 #define DGST_R3 1
17
18 #include "include/kernel_functions.c"
19 #include "OpenCL/types_ocl.c"
20 #include "OpenCL/common.c"
21 #include "OpenCL/simd.c"
22
23 static void m00020m (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset)
24 {
25   /**
26    * modifier
27    */
28
29   const u32 gid = get_global_id (0);
30   const u32 lid = get_local_id (0);
31
32   /**
33    * salt
34    */
35
36   u32 salt_buf0[4];
37
38   salt_buf0[0] = salt_bufs[salt_pos].salt_buf[ 0];
39   salt_buf0[1] = salt_bufs[salt_pos].salt_buf[ 1];
40   salt_buf0[2] = salt_bufs[salt_pos].salt_buf[ 2];
41   salt_buf0[3] = salt_bufs[salt_pos].salt_buf[ 3];
42
43   u32 salt_buf1[4];
44
45   salt_buf1[0] = salt_bufs[salt_pos].salt_buf[ 4];
46   salt_buf1[1] = salt_bufs[salt_pos].salt_buf[ 5];
47   salt_buf1[2] = salt_bufs[salt_pos].salt_buf[ 6];
48   salt_buf1[3] = salt_bufs[salt_pos].salt_buf[ 7];
49
50   u32 salt_buf2[4];
51
52   salt_buf2[0] = 0;
53   salt_buf2[1] = 0;
54   salt_buf2[2] = 0;
55   salt_buf2[3] = 0;
56
57   u32 salt_buf3[4];
58
59   salt_buf3[0] = 0;
60   salt_buf3[1] = 0;
61   salt_buf3[2] = 0;
62   salt_buf3[3] = 0;
63
64   const u32 salt_len = salt_bufs[salt_pos].salt_len;
65
66   const u32 pw_salt_len = pw_len + salt_len;
67
68   /**
69    * loop
70    */
71
72   u32 w0l = w0[0];
73
74   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos += VECT_SIZE)
75   {
76     #if   VECT_SIZE == 1
77     const u32x w0r = (u32x) (bfs_buf[il_pos + 0].i);
78     #elif VECT_SIZE == 2
79     const u32x w0r = (u32x) (bfs_buf[il_pos + 0].i, bfs_buf[il_pos + 1].i);
80     #elif VECT_SIZE == 4
81     const u32x w0r = (u32x) (bfs_buf[il_pos + 0].i, bfs_buf[il_pos + 1].i, bfs_buf[il_pos + 2].i, bfs_buf[il_pos + 3].i);
82     #elif VECT_SIZE == 8
83     const u32x w0r = (u32x) (bfs_buf[il_pos + 0].i, bfs_buf[il_pos + 1].i, bfs_buf[il_pos + 2].i, bfs_buf[il_pos + 3].i, bfs_buf[il_pos + 4].i, bfs_buf[il_pos + 5].i, bfs_buf[il_pos + 6].i, bfs_buf[il_pos + 7].i);
84     #endif
85
86     const u32x w0lr = w0l | w0r;
87
88     /**
89      * prepend salt
90      */
91
92     u32x w0_t[4];
93     u32x w1_t[4];
94     u32x w2_t[4];
95     u32x w3_t[4];
96
97     w0_t[0] = w0lr;
98     w0_t[1] = w0[1];
99     w0_t[2] = w0[2];
100     w0_t[3] = w0[3];
101     w1_t[0] = w1[0];
102     w1_t[1] = w1[1];
103     w1_t[2] = w1[2];
104     w1_t[3] = w1[3];
105     w2_t[0] = w2[0];
106     w2_t[1] = w2[1];
107     w2_t[2] = w2[2];
108     w2_t[3] = w2[3];
109     w3_t[0] = w3[0];
110     w3_t[1] = w3[1];
111     w3_t[2] = w3[2];
112     w3_t[3] = w3[3];
113
114     switch_buffer_by_offset (w0_t, w1_t, w2_t, w3_t, salt_len);
115
116     w3_t[2] = pw_salt_len * 8;
117
118     w0_t[0] |= salt_buf0[0];
119     w0_t[1] |= salt_buf0[1];
120     w0_t[2] |= salt_buf0[2];
121     w0_t[3] |= salt_buf0[3];
122     w1_t[0] |= salt_buf1[0];
123     w1_t[1] |= salt_buf1[1];
124     w1_t[2] |= salt_buf1[2];
125     w1_t[3] |= salt_buf1[3];
126     w2_t[0] |= salt_buf2[0];
127     w2_t[1] |= salt_buf2[1];
128     w2_t[2] |= salt_buf2[2];
129     w2_t[3] |= salt_buf2[3];
130     w3_t[0] |= salt_buf3[0];
131     w3_t[1] |= salt_buf3[1];
132     w3_t[2] |= salt_buf3[2];
133     w3_t[3] |= salt_buf3[3];
134
135     /**
136      * md5
137      */
138
139     u32x tmp2;
140
141     u32x a = MD5M_A;
142     u32x b = MD5M_B;
143     u32x c = MD5M_C;
144     u32x d = MD5M_D;
145
146     MD5_STEP (MD5_Fo, a, b, c, d, w0_t[0], MD5C00, MD5S00);
147     MD5_STEP (MD5_Fo, d, a, b, c, w0_t[1], MD5C01, MD5S01);
148     MD5_STEP (MD5_Fo, c, d, a, b, w0_t[2], MD5C02, MD5S02);
149     MD5_STEP (MD5_Fo, b, c, d, a, w0_t[3], MD5C03, MD5S03);
150     MD5_STEP (MD5_Fo, a, b, c, d, w1_t[0], MD5C04, MD5S00);
151     MD5_STEP (MD5_Fo, d, a, b, c, w1_t[1], MD5C05, MD5S01);
152     MD5_STEP (MD5_Fo, c, d, a, b, w1_t[2], MD5C06, MD5S02);
153     MD5_STEP (MD5_Fo, b, c, d, a, w1_t[3], MD5C07, MD5S03);
154     MD5_STEP (MD5_Fo, a, b, c, d, w2_t[0], MD5C08, MD5S00);
155     MD5_STEP (MD5_Fo, d, a, b, c, w2_t[1], MD5C09, MD5S01);
156     MD5_STEP (MD5_Fo, c, d, a, b, w2_t[2], MD5C0a, MD5S02);
157     MD5_STEP (MD5_Fo, b, c, d, a, w2_t[3], MD5C0b, MD5S03);
158     MD5_STEP (MD5_Fo, a, b, c, d, w3_t[0], MD5C0c, MD5S00);
159     MD5_STEP (MD5_Fo, d, a, b, c, w3_t[1], MD5C0d, MD5S01);
160     MD5_STEP (MD5_Fo, c, d, a, b, w3_t[2], MD5C0e, MD5S02);
161     MD5_STEP (MD5_Fo, b, c, d, a, w3_t[3], MD5C0f, MD5S03);
162
163     MD5_STEP (MD5_Go, a, b, c, d, w0_t[1], MD5C10, MD5S10);
164     MD5_STEP (MD5_Go, d, a, b, c, w1_t[2], MD5C11, MD5S11);
165     MD5_STEP (MD5_Go, c, d, a, b, w2_t[3], MD5C12, MD5S12);
166     MD5_STEP (MD5_Go, b, c, d, a, w0_t[0], MD5C13, MD5S13);
167     MD5_STEP (MD5_Go, a, b, c, d, w1_t[1], MD5C14, MD5S10);
168     MD5_STEP (MD5_Go, d, a, b, c, w2_t[2], MD5C15, MD5S11);
169     MD5_STEP (MD5_Go, c, d, a, b, w3_t[3], MD5C16, MD5S12);
170     MD5_STEP (MD5_Go, b, c, d, a, w1_t[0], MD5C17, MD5S13);
171     MD5_STEP (MD5_Go, a, b, c, d, w2_t[1], MD5C18, MD5S10);
172     MD5_STEP (MD5_Go, d, a, b, c, w3_t[2], MD5C19, MD5S11);
173     MD5_STEP (MD5_Go, c, d, a, b, w0_t[3], MD5C1a, MD5S12);
174     MD5_STEP (MD5_Go, b, c, d, a, w2_t[0], MD5C1b, MD5S13);
175     MD5_STEP (MD5_Go, a, b, c, d, w3_t[1], MD5C1c, MD5S10);
176     MD5_STEP (MD5_Go, d, a, b, c, w0_t[2], MD5C1d, MD5S11);
177     MD5_STEP (MD5_Go, c, d, a, b, w1_t[3], MD5C1e, MD5S12);
178     MD5_STEP (MD5_Go, b, c, d, a, w3_t[0], MD5C1f, MD5S13);
179
180     MD5_STEP (MD5_H1, a, b, c, d, w1_t[1], MD5C20, MD5S20);
181     MD5_STEP (MD5_H2, d, a, b, c, w2_t[0], MD5C21, MD5S21);
182     MD5_STEP (MD5_H1, c, d, a, b, w2_t[3], MD5C22, MD5S22);
183     MD5_STEP (MD5_H2, b, c, d, a, w3_t[2], MD5C23, MD5S23);
184     MD5_STEP (MD5_H1, a, b, c, d, w0_t[1], MD5C24, MD5S20);
185     MD5_STEP (MD5_H2, d, a, b, c, w1_t[0], MD5C25, MD5S21);
186     MD5_STEP (MD5_H1, c, d, a, b, w1_t[3], MD5C26, MD5S22);
187     MD5_STEP (MD5_H2, b, c, d, a, w2_t[2], MD5C27, MD5S23);
188     MD5_STEP (MD5_H1, a, b, c, d, w3_t[1], MD5C28, MD5S20);
189     MD5_STEP (MD5_H2, d, a, b, c, w0_t[0], MD5C29, MD5S21);
190     MD5_STEP (MD5_H1, c, d, a, b, w0_t[3], MD5C2a, MD5S22);
191     MD5_STEP (MD5_H2, b, c, d, a, w1_t[2], MD5C2b, MD5S23);
192     MD5_STEP (MD5_H1, a, b, c, d, w2_t[1], MD5C2c, MD5S20);
193     MD5_STEP (MD5_H2, d, a, b, c, w3_t[0], MD5C2d, MD5S21);
194     MD5_STEP (MD5_H1, c, d, a, b, w3_t[3], MD5C2e, MD5S22);
195     MD5_STEP (MD5_H2, b, c, d, a, w0_t[2], MD5C2f, MD5S23);
196
197     MD5_STEP (MD5_I , a, b, c, d, w0_t[0], MD5C30, MD5S30);
198     MD5_STEP (MD5_I , d, a, b, c, w1_t[3], MD5C31, MD5S31);
199     MD5_STEP (MD5_I , c, d, a, b, w3_t[2], MD5C32, MD5S32);
200     MD5_STEP (MD5_I , b, c, d, a, w1_t[1], MD5C33, MD5S33);
201     MD5_STEP (MD5_I , a, b, c, d, w3_t[0], MD5C34, MD5S30);
202     MD5_STEP (MD5_I , d, a, b, c, w0_t[3], MD5C35, MD5S31);
203     MD5_STEP (MD5_I , c, d, a, b, w2_t[2], MD5C36, MD5S32);
204     MD5_STEP (MD5_I , b, c, d, a, w0_t[1], MD5C37, MD5S33);
205     MD5_STEP (MD5_I , a, b, c, d, w2_t[0], MD5C38, MD5S30);
206     MD5_STEP (MD5_I , d, a, b, c, w3_t[3], MD5C39, MD5S31);
207     MD5_STEP (MD5_I , c, d, a, b, w1_t[2], MD5C3a, MD5S32);
208     MD5_STEP (MD5_I , b, c, d, a, w3_t[1], MD5C3b, MD5S33);
209     MD5_STEP (MD5_I , a, b, c, d, w1_t[0], MD5C3c, MD5S30);
210     MD5_STEP (MD5_I , d, a, b, c, w2_t[3], MD5C3d, MD5S31);
211     MD5_STEP (MD5_I , c, d, a, b, w0_t[2], MD5C3e, MD5S32);
212     MD5_STEP (MD5_I , b, c, d, a, w2_t[1], MD5C3f, MD5S33);
213
214     COMPARE_M_SIMD (a, d, c, b);
215   }
216 }
217
218 static void m00020s (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset)
219 {
220   /**
221    * modifier
222    */
223
224   const u32 gid = get_global_id (0);
225   const u32 lid = get_local_id (0);
226
227   /**
228    * digest
229    */
230
231   const u32 search[4] =
232   {
233     digests_buf[digests_offset].digest_buf[DGST_R0],
234     digests_buf[digests_offset].digest_buf[DGST_R1],
235     digests_buf[digests_offset].digest_buf[DGST_R2],
236     digests_buf[digests_offset].digest_buf[DGST_R3]
237   };
238
239   /**
240    * salt
241    */
242
243   u32 salt_buf0[4];
244
245   salt_buf0[0] = salt_bufs[salt_pos].salt_buf[ 0];
246   salt_buf0[1] = salt_bufs[salt_pos].salt_buf[ 1];
247   salt_buf0[2] = salt_bufs[salt_pos].salt_buf[ 2];
248   salt_buf0[3] = salt_bufs[salt_pos].salt_buf[ 3];
249
250   u32 salt_buf1[4];
251
252   salt_buf1[0] = salt_bufs[salt_pos].salt_buf[ 4];
253   salt_buf1[1] = salt_bufs[salt_pos].salt_buf[ 5];
254   salt_buf1[2] = salt_bufs[salt_pos].salt_buf[ 6];
255   salt_buf1[3] = salt_bufs[salt_pos].salt_buf[ 7];
256
257   u32 salt_buf2[4];
258
259   salt_buf2[0] = 0;
260   salt_buf2[1] = 0;
261   salt_buf2[2] = 0;
262   salt_buf2[3] = 0;
263
264   u32 salt_buf3[4];
265
266   salt_buf3[0] = 0;
267   salt_buf3[1] = 0;
268   salt_buf3[2] = 0;
269   salt_buf3[3] = 0;
270
271   const u32 salt_len = salt_bufs[salt_pos].salt_len;
272
273   const u32 pw_salt_len = pw_len + salt_len;
274
275   /**
276    * loop
277    */
278
279   u32 w0l = w0[0];
280
281   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos += VECT_SIZE)
282   {
283     #if   VECT_SIZE == 1
284     const u32x w0r = (u32x) (bfs_buf[il_pos + 0].i);
285     #elif VECT_SIZE == 2
286     const u32x w0r = (u32x) (bfs_buf[il_pos + 0].i, bfs_buf[il_pos + 1].i);
287     #elif VECT_SIZE == 4
288     const u32x w0r = (u32x) (bfs_buf[il_pos + 0].i, bfs_buf[il_pos + 1].i, bfs_buf[il_pos + 2].i, bfs_buf[il_pos + 3].i);
289     #elif VECT_SIZE == 8
290     const u32x w0r = (u32x) (bfs_buf[il_pos + 0].i, bfs_buf[il_pos + 1].i, bfs_buf[il_pos + 2].i, bfs_buf[il_pos + 3].i, bfs_buf[il_pos + 4].i, bfs_buf[il_pos + 5].i, bfs_buf[il_pos + 6].i, bfs_buf[il_pos + 7].i);
291     #endif
292
293     const u32x w0lr = w0l | w0r;
294
295     /**
296      * prepend salt
297      */
298
299     u32x w0_t[4];
300     u32x w1_t[4];
301     u32x w2_t[4];
302     u32x w3_t[4];
303
304     w0_t[0] = w0lr;
305     w0_t[1] = w0[1];
306     w0_t[2] = w0[2];
307     w0_t[3] = w0[3];
308     w1_t[0] = w1[0];
309     w1_t[1] = w1[1];
310     w1_t[2] = w1[2];
311     w1_t[3] = w1[3];
312     w2_t[0] = w2[0];
313     w2_t[1] = w2[1];
314     w2_t[2] = w2[2];
315     w2_t[3] = w2[3];
316     w3_t[0] = w3[0];
317     w3_t[1] = w3[1];
318     w3_t[2] = w3[2];
319     w3_t[3] = w3[3];
320
321     switch_buffer_by_offset (w0_t, w1_t, w2_t, w3_t, salt_len);
322
323     w3_t[2] = pw_salt_len * 8;
324
325     w0_t[0] |= salt_buf0[0];
326     w0_t[1] |= salt_buf0[1];
327     w0_t[2] |= salt_buf0[2];
328     w0_t[3] |= salt_buf0[3];
329     w1_t[0] |= salt_buf1[0];
330     w1_t[1] |= salt_buf1[1];
331     w1_t[2] |= salt_buf1[2];
332     w1_t[3] |= salt_buf1[3];
333     w2_t[0] |= salt_buf2[0];
334     w2_t[1] |= salt_buf2[1];
335     w2_t[2] |= salt_buf2[2];
336     w2_t[3] |= salt_buf2[3];
337     w3_t[0] |= salt_buf3[0];
338     w3_t[1] |= salt_buf3[1];
339     w3_t[2] |= salt_buf3[2];
340     w3_t[3] |= salt_buf3[3];
341
342     /**
343      * md5
344      */
345
346     u32x tmp2;
347
348     u32x a = MD5M_A;
349     u32x b = MD5M_B;
350     u32x c = MD5M_C;
351     u32x d = MD5M_D;
352
353     MD5_STEP (MD5_Fo, a, b, c, d, w0_t[0], MD5C00, MD5S00);
354     MD5_STEP (MD5_Fo, d, a, b, c, w0_t[1], MD5C01, MD5S01);
355     MD5_STEP (MD5_Fo, c, d, a, b, w0_t[2], MD5C02, MD5S02);
356     MD5_STEP (MD5_Fo, b, c, d, a, w0_t[3], MD5C03, MD5S03);
357     MD5_STEP (MD5_Fo, a, b, c, d, w1_t[0], MD5C04, MD5S00);
358     MD5_STEP (MD5_Fo, d, a, b, c, w1_t[1], MD5C05, MD5S01);
359     MD5_STEP (MD5_Fo, c, d, a, b, w1_t[2], MD5C06, MD5S02);
360     MD5_STEP (MD5_Fo, b, c, d, a, w1_t[3], MD5C07, MD5S03);
361     MD5_STEP (MD5_Fo, a, b, c, d, w2_t[0], MD5C08, MD5S00);
362     MD5_STEP (MD5_Fo, d, a, b, c, w2_t[1], MD5C09, MD5S01);
363     MD5_STEP (MD5_Fo, c, d, a, b, w2_t[2], MD5C0a, MD5S02);
364     MD5_STEP (MD5_Fo, b, c, d, a, w2_t[3], MD5C0b, MD5S03);
365     MD5_STEP (MD5_Fo, a, b, c, d, w3_t[0], MD5C0c, MD5S00);
366     MD5_STEP (MD5_Fo, d, a, b, c, w3_t[1], MD5C0d, MD5S01);
367     MD5_STEP (MD5_Fo, c, d, a, b, w3_t[2], MD5C0e, MD5S02);
368     MD5_STEP (MD5_Fo, b, c, d, a, w3_t[3], MD5C0f, MD5S03);
369
370     MD5_STEP (MD5_Go, a, b, c, d, w0_t[1], MD5C10, MD5S10);
371     MD5_STEP (MD5_Go, d, a, b, c, w1_t[2], MD5C11, MD5S11);
372     MD5_STEP (MD5_Go, c, d, a, b, w2_t[3], MD5C12, MD5S12);
373     MD5_STEP (MD5_Go, b, c, d, a, w0_t[0], MD5C13, MD5S13);
374     MD5_STEP (MD5_Go, a, b, c, d, w1_t[1], MD5C14, MD5S10);
375     MD5_STEP (MD5_Go, d, a, b, c, w2_t[2], MD5C15, MD5S11);
376     MD5_STEP (MD5_Go, c, d, a, b, w3_t[3], MD5C16, MD5S12);
377     MD5_STEP (MD5_Go, b, c, d, a, w1_t[0], MD5C17, MD5S13);
378     MD5_STEP (MD5_Go, a, b, c, d, w2_t[1], MD5C18, MD5S10);
379     MD5_STEP (MD5_Go, d, a, b, c, w3_t[2], MD5C19, MD5S11);
380     MD5_STEP (MD5_Go, c, d, a, b, w0_t[3], MD5C1a, MD5S12);
381     MD5_STEP (MD5_Go, b, c, d, a, w2_t[0], MD5C1b, MD5S13);
382     MD5_STEP (MD5_Go, a, b, c, d, w3_t[1], MD5C1c, MD5S10);
383     MD5_STEP (MD5_Go, d, a, b, c, w0_t[2], MD5C1d, MD5S11);
384     MD5_STEP (MD5_Go, c, d, a, b, w1_t[3], MD5C1e, MD5S12);
385     MD5_STEP (MD5_Go, b, c, d, a, w3_t[0], MD5C1f, MD5S13);
386
387     MD5_STEP (MD5_H1, a, b, c, d, w1_t[1], MD5C20, MD5S20);
388     MD5_STEP (MD5_H2, d, a, b, c, w2_t[0], MD5C21, MD5S21);
389     MD5_STEP (MD5_H1, c, d, a, b, w2_t[3], MD5C22, MD5S22);
390     MD5_STEP (MD5_H2, b, c, d, a, w3_t[2], MD5C23, MD5S23);
391     MD5_STEP (MD5_H1, a, b, c, d, w0_t[1], MD5C24, MD5S20);
392     MD5_STEP (MD5_H2, d, a, b, c, w1_t[0], MD5C25, MD5S21);
393     MD5_STEP (MD5_H1, c, d, a, b, w1_t[3], MD5C26, MD5S22);
394     MD5_STEP (MD5_H2, b, c, d, a, w2_t[2], MD5C27, MD5S23);
395     MD5_STEP (MD5_H1, a, b, c, d, w3_t[1], MD5C28, MD5S20);
396     MD5_STEP (MD5_H2, d, a, b, c, w0_t[0], MD5C29, MD5S21);
397     MD5_STEP (MD5_H1, c, d, a, b, w0_t[3], MD5C2a, MD5S22);
398     MD5_STEP (MD5_H2, b, c, d, a, w1_t[2], MD5C2b, MD5S23);
399     MD5_STEP (MD5_H1, a, b, c, d, w2_t[1], MD5C2c, MD5S20);
400     MD5_STEP (MD5_H2, d, a, b, c, w3_t[0], MD5C2d, MD5S21);
401     MD5_STEP (MD5_H1, c, d, a, b, w3_t[3], MD5C2e, MD5S22);
402     MD5_STEP (MD5_H2, b, c, d, a, w0_t[2], MD5C2f, MD5S23);
403
404     MD5_STEP (MD5_I , a, b, c, d, w0_t[0], MD5C30, MD5S30);
405     MD5_STEP (MD5_I , d, a, b, c, w1_t[3], MD5C31, MD5S31);
406     MD5_STEP (MD5_I , c, d, a, b, w3_t[2], MD5C32, MD5S32);
407     MD5_STEP (MD5_I , b, c, d, a, w1_t[1], MD5C33, MD5S33);
408     MD5_STEP (MD5_I , a, b, c, d, w3_t[0], MD5C34, MD5S30);
409     MD5_STEP (MD5_I , d, a, b, c, w0_t[3], MD5C35, MD5S31);
410     MD5_STEP (MD5_I , c, d, a, b, w2_t[2], MD5C36, MD5S32);
411     MD5_STEP (MD5_I , b, c, d, a, w0_t[1], MD5C37, MD5S33);
412     MD5_STEP (MD5_I , a, b, c, d, w2_t[0], MD5C38, MD5S30);
413     MD5_STEP (MD5_I , d, a, b, c, w3_t[3], MD5C39, MD5S31);
414     MD5_STEP (MD5_I , c, d, a, b, w1_t[2], MD5C3a, MD5S32);
415     MD5_STEP (MD5_I , b, c, d, a, w3_t[1], MD5C3b, MD5S33);
416     MD5_STEP (MD5_I , a, b, c, d, w1_t[0], MD5C3c, MD5S30);
417
418     if (MATCHES_NONE_VS (a, search[0])) continue;
419
420     MD5_STEP (MD5_I , d, a, b, c, w2_t[3], MD5C3d, MD5S31);
421     MD5_STEP (MD5_I , c, d, a, b, w0_t[2], MD5C3e, MD5S32);
422     MD5_STEP (MD5_I , b, c, d, a, w2_t[1], MD5C3f, MD5S33);
423
424     COMPARE_S_SIMD (a, d, c, b);
425   }
426 }
427
428 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m00020_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
429 {
430   /**
431    * base
432    */
433
434   const u32 gid = get_global_id (0);
435
436   if (gid >= gid_max) return;
437
438   u32 w0[4];
439
440   w0[0] = pws[gid].i[ 0];
441   w0[1] = pws[gid].i[ 1];
442   w0[2] = pws[gid].i[ 2];
443   w0[3] = pws[gid].i[ 3];
444
445   u32 w1[4];
446
447   w1[0] = 0;
448   w1[1] = 0;
449   w1[2] = 0;
450   w1[3] = 0;
451
452   u32 w2[4];
453
454   w2[0] = 0;
455   w2[1] = 0;
456   w2[2] = 0;
457   w2[3] = 0;
458
459   u32 w3[4];
460
461   w3[0] = 0;
462   w3[1] = 0;
463   w3[2] = 0;
464   w3[3] = 0;
465
466   const u32 pw_len = pws[gid].pw_len;
467
468   /**
469    * main
470    */
471
472   m00020m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
473 }
474
475 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m00020_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
476 {
477   /**
478    * base
479    */
480
481   const u32 gid = get_global_id (0);
482
483   if (gid >= gid_max) return;
484
485   u32 w0[4];
486
487   w0[0] = pws[gid].i[ 0];
488   w0[1] = pws[gid].i[ 1];
489   w0[2] = pws[gid].i[ 2];
490   w0[3] = pws[gid].i[ 3];
491
492   u32 w1[4];
493
494   w1[0] = pws[gid].i[ 4];
495   w1[1] = pws[gid].i[ 5];
496   w1[2] = pws[gid].i[ 6];
497   w1[3] = pws[gid].i[ 7];
498
499   u32 w2[4];
500
501   w2[0] = 0;
502   w2[1] = 0;
503   w2[2] = 0;
504   w2[3] = 0;
505
506   u32 w3[4];
507
508   w3[0] = 0;
509   w3[1] = 0;
510   w3[2] = 0;
511   w3[3] = 0;
512
513   const u32 pw_len = pws[gid].pw_len;
514
515   /**
516    * main
517    */
518
519   m00020m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
520 }
521
522 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m00020_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
523 {
524   /**
525    * base
526    */
527
528   const u32 gid = get_global_id (0);
529
530   if (gid >= gid_max) return;
531
532   u32 w0[4];
533
534   w0[0] = pws[gid].i[ 0];
535   w0[1] = pws[gid].i[ 1];
536   w0[2] = pws[gid].i[ 2];
537   w0[3] = pws[gid].i[ 3];
538
539   u32 w1[4];
540
541   w1[0] = pws[gid].i[ 4];
542   w1[1] = pws[gid].i[ 5];
543   w1[2] = pws[gid].i[ 6];
544   w1[3] = pws[gid].i[ 7];
545
546   u32 w2[4];
547
548   w2[0] = pws[gid].i[ 8];
549   w2[1] = pws[gid].i[ 9];
550   w2[2] = pws[gid].i[10];
551   w2[3] = pws[gid].i[11];
552
553   u32 w3[4];
554
555   w3[0] = pws[gid].i[12];
556   w3[1] = pws[gid].i[13];
557   w3[2] = 0;
558   w3[3] = 0;
559
560   const u32 pw_len = pws[gid].pw_len;
561
562   /**
563    * main
564    */
565
566   m00020m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
567 }
568
569 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m00020_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
570 {
571   /**
572    * base
573    */
574
575   const u32 gid = get_global_id (0);
576
577   if (gid >= gid_max) return;
578
579   u32 w0[4];
580
581   w0[0] = pws[gid].i[ 0];
582   w0[1] = pws[gid].i[ 1];
583   w0[2] = pws[gid].i[ 2];
584   w0[3] = pws[gid].i[ 3];
585
586   u32 w1[4];
587
588   w1[0] = 0;
589   w1[1] = 0;
590   w1[2] = 0;
591   w1[3] = 0;
592
593   u32 w2[4];
594
595   w2[0] = 0;
596   w2[1] = 0;
597   w2[2] = 0;
598   w2[3] = 0;
599
600   u32 w3[4];
601
602   w3[0] = 0;
603   w3[1] = 0;
604   w3[2] = 0;
605   w3[3] = 0;
606
607   const u32 pw_len = pws[gid].pw_len;
608
609   /**
610    * main
611    */
612
613   m00020s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
614 }
615
616 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m00020_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
617 {
618   /**
619    * base
620    */
621
622   const u32 gid = get_global_id (0);
623
624   if (gid >= gid_max) return;
625
626   u32 w0[4];
627
628   w0[0] = pws[gid].i[ 0];
629   w0[1] = pws[gid].i[ 1];
630   w0[2] = pws[gid].i[ 2];
631   w0[3] = pws[gid].i[ 3];
632
633   u32 w1[4];
634
635   w1[0] = pws[gid].i[ 4];
636   w1[1] = pws[gid].i[ 5];
637   w1[2] = pws[gid].i[ 6];
638   w1[3] = pws[gid].i[ 7];
639
640   u32 w2[4];
641
642   w2[0] = 0;
643   w2[1] = 0;
644   w2[2] = 0;
645   w2[3] = 0;
646
647   u32 w3[4];
648
649   w3[0] = 0;
650   w3[1] = 0;
651   w3[2] = 0;
652   w3[3] = 0;
653
654   const u32 pw_len = pws[gid].pw_len;
655
656   /**
657    * main
658    */
659
660   m00020s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
661 }
662
663 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m00020_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
664 {
665   /**
666    * base
667    */
668
669   const u32 gid = get_global_id (0);
670
671   if (gid >= gid_max) return;
672
673   u32 w0[4];
674
675   w0[0] = pws[gid].i[ 0];
676   w0[1] = pws[gid].i[ 1];
677   w0[2] = pws[gid].i[ 2];
678   w0[3] = pws[gid].i[ 3];
679
680   u32 w1[4];
681
682   w1[0] = pws[gid].i[ 4];
683   w1[1] = pws[gid].i[ 5];
684   w1[2] = pws[gid].i[ 6];
685   w1[3] = pws[gid].i[ 7];
686
687   u32 w2[4];
688
689   w2[0] = pws[gid].i[ 8];
690   w2[1] = pws[gid].i[ 9];
691   w2[2] = pws[gid].i[10];
692   w2[3] = pws[gid].i[11];
693
694   u32 w3[4];
695
696   w3[0] = pws[gid].i[12];
697   w3[1] = pws[gid].i[13];
698   w3[2] = 0;
699   w3[3] = 0;
700
701   const u32 pw_len = pws[gid].pw_len;
702
703   /**
704    * main
705    */
706
707   m00020s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset);
708 }