Fixed two major problems
[hashcat.git] / OpenCL / m04800_a3.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #define NEW_SIMD_CODE
9
10 #include "include/constants.h"
11 #include "include/kernel_vendor.h"
12
13 #define DGST_R0 0
14 #define DGST_R1 3
15 #define DGST_R2 2
16 #define DGST_R3 1
17
18 #include "include/kernel_functions.c"
19 #include "OpenCL/types_ocl.c"
20 #include "OpenCL/common.c"
21 #include "OpenCL/simd.c"
22
23 static void m04800m (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset)
24 {
25   /**
26    * modifier
27    */
28
29   const u32 gid = get_global_id (0);
30   const u32 lid = get_local_id (0);
31
32   /**
33    * salt
34    */
35
36   u32 salt_buf[5];
37
38   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
39   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
40   salt_buf[2] = salt_bufs[salt_pos].salt_buf[2];
41   salt_buf[3] = salt_bufs[salt_pos].salt_buf[3];
42   salt_buf[4] = salt_bufs[salt_pos].salt_buf[4];
43
44   const u32 salt_len = salt_bufs[salt_pos].salt_len;
45
46   const u32 pw_salt_len = pw_len + salt_len;
47
48   u32 s0[4];
49
50   s0[0] = salt_buf[0];
51   s0[1] = salt_buf[1];
52   s0[2] = salt_buf[2];
53   s0[3] = salt_buf[3];
54
55   u32 s1[4];
56
57   s1[0] = 0x80;
58   s1[1] = 0;
59   s1[2] = 0;
60   s1[3] = 0;
61
62   u32 s2[4];
63
64   s2[0] = 0;
65   s2[1] = 0;
66   s2[2] = 0;
67   s2[3] = 0;
68
69   u32 s3[4];
70
71   s3[0] = 0;
72   s3[1] = 0;
73   s3[2] = 0;
74   s3[3] = 0;
75
76   // move w by 1
77
78   u32x w0_t[4];
79
80   w0_t[0] = w0[0];
81   w0_t[1] = w0[1];
82   w0_t[2] = w0[2];
83   w0_t[3] = w0[3];
84
85   u32x w1_t[4];
86
87   w1_t[0] = w1[0];
88   w1_t[1] = w1[1];
89   w1_t[2] = w1[2];
90   w1_t[3] = w1[3];
91
92   u32x w2_t[4];
93
94   w2_t[0] = 0;
95   w2_t[1] = 0;
96   w2_t[2] = 0;
97   w2_t[3] = 0;
98
99   u32x w3_t[4];
100
101   w3_t[0] = 0;
102   w3_t[1] = 0;
103   w3_t[2] = 0;
104   w3_t[3] = 0;
105
106   switch_buffer_by_offset_le (w0_t, w1_t, w2_t, w3_t, 1);
107
108   switch_buffer_by_offset_le_S (s0, s1, s2, s3, 1 + pw_len);
109
110   w0_t[0] |= s0[0];
111   w0_t[1] |= s0[1];
112   w0_t[2] |= s0[2];
113   w0_t[3] |= s0[3];
114
115   w1_t[0] |= s1[0];
116   w1_t[1] |= s1[1];
117   w1_t[2] |= s1[2];
118   w1_t[3] |= s1[3];
119
120   w2_t[0] |= s2[0];
121   w2_t[1] |= s2[1];
122   w2_t[2] |= s2[2];
123   w2_t[3] |= s2[3];
124
125   w3_t[0] |= s3[0];
126   w3_t[1] |= s3[1];
127   w3_t[2]  = pw_salt_len * 8;
128   w3_t[3]  = 0;
129
130   /**
131    * add id byte
132    */
133
134   w0_t[0] |= salt_buf[4];
135
136   /**
137    * loop
138    */
139
140   u32x w0l = w0_t[0];
141   u32x w1l = w0_t[1];
142
143   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
144   {
145     const u32x w0r = ix_create_bft (bfs_buf, il_pos);
146
147     w0_t[0] = w0l | (w0r <<  8);
148     w0_t[1] = w1l | (w0r >> 24);
149
150     /**
151      * md5
152      */
153
154     u32x a = MD5M_A;
155     u32x b = MD5M_B;
156     u32x c = MD5M_C;
157     u32x d = MD5M_D;
158
159     MD5_STEP (MD5_Fo, a, b, c, d, w0_t[0], MD5C00, MD5S00);
160     MD5_STEP (MD5_Fo, d, a, b, c, w0_t[1], MD5C01, MD5S01);
161     MD5_STEP (MD5_Fo, c, d, a, b, w0_t[2], MD5C02, MD5S02);
162     MD5_STEP (MD5_Fo, b, c, d, a, w0_t[3], MD5C03, MD5S03);
163     MD5_STEP (MD5_Fo, a, b, c, d, w1_t[0], MD5C04, MD5S00);
164     MD5_STEP (MD5_Fo, d, a, b, c, w1_t[1], MD5C05, MD5S01);
165     MD5_STEP (MD5_Fo, c, d, a, b, w1_t[2], MD5C06, MD5S02);
166     MD5_STEP (MD5_Fo, b, c, d, a, w1_t[3], MD5C07, MD5S03);
167     MD5_STEP (MD5_Fo, a, b, c, d, w2_t[0], MD5C08, MD5S00);
168     MD5_STEP (MD5_Fo, d, a, b, c, w2_t[1], MD5C09, MD5S01);
169     MD5_STEP (MD5_Fo, c, d, a, b, w2_t[2], MD5C0a, MD5S02);
170     MD5_STEP (MD5_Fo, b, c, d, a, w2_t[3], MD5C0b, MD5S03);
171     MD5_STEP (MD5_Fo, a, b, c, d, w3_t[0], MD5C0c, MD5S00);
172     MD5_STEP (MD5_Fo, d, a, b, c, w3_t[1], MD5C0d, MD5S01);
173     MD5_STEP (MD5_Fo, c, d, a, b, w3_t[2], MD5C0e, MD5S02);
174     MD5_STEP (MD5_Fo, b, c, d, a, w3_t[3], MD5C0f, MD5S03);
175
176     MD5_STEP (MD5_Go, a, b, c, d, w0_t[1], MD5C10, MD5S10);
177     MD5_STEP (MD5_Go, d, a, b, c, w1_t[2], MD5C11, MD5S11);
178     MD5_STEP (MD5_Go, c, d, a, b, w2_t[3], MD5C12, MD5S12);
179     MD5_STEP (MD5_Go, b, c, d, a, w0_t[0], MD5C13, MD5S13);
180     MD5_STEP (MD5_Go, a, b, c, d, w1_t[1], MD5C14, MD5S10);
181     MD5_STEP (MD5_Go, d, a, b, c, w2_t[2], MD5C15, MD5S11);
182     MD5_STEP (MD5_Go, c, d, a, b, w3_t[3], MD5C16, MD5S12);
183     MD5_STEP (MD5_Go, b, c, d, a, w1_t[0], MD5C17, MD5S13);
184     MD5_STEP (MD5_Go, a, b, c, d, w2_t[1], MD5C18, MD5S10);
185     MD5_STEP (MD5_Go, d, a, b, c, w3_t[2], MD5C19, MD5S11);
186     MD5_STEP (MD5_Go, c, d, a, b, w0_t[3], MD5C1a, MD5S12);
187     MD5_STEP (MD5_Go, b, c, d, a, w2_t[0], MD5C1b, MD5S13);
188     MD5_STEP (MD5_Go, a, b, c, d, w3_t[1], MD5C1c, MD5S10);
189     MD5_STEP (MD5_Go, d, a, b, c, w0_t[2], MD5C1d, MD5S11);
190     MD5_STEP (MD5_Go, c, d, a, b, w1_t[3], MD5C1e, MD5S12);
191     MD5_STEP (MD5_Go, b, c, d, a, w3_t[0], MD5C1f, MD5S13);
192
193     MD5_STEP (MD5_H , a, b, c, d, w1_t[1], MD5C20, MD5S20);
194     MD5_STEP (MD5_H , d, a, b, c, w2_t[0], MD5C21, MD5S21);
195     MD5_STEP (MD5_H , c, d, a, b, w2_t[3], MD5C22, MD5S22);
196     MD5_STEP (MD5_H , b, c, d, a, w3_t[2], MD5C23, MD5S23);
197     MD5_STEP (MD5_H , a, b, c, d, w0_t[1], MD5C24, MD5S20);
198     MD5_STEP (MD5_H , d, a, b, c, w1_t[0], MD5C25, MD5S21);
199     MD5_STEP (MD5_H , c, d, a, b, w1_t[3], MD5C26, MD5S22);
200     MD5_STEP (MD5_H , b, c, d, a, w2_t[2], MD5C27, MD5S23);
201     MD5_STEP (MD5_H , a, b, c, d, w3_t[1], MD5C28, MD5S20);
202     MD5_STEP (MD5_H , d, a, b, c, w0_t[0], MD5C29, MD5S21);
203     MD5_STEP (MD5_H , c, d, a, b, w0_t[3], MD5C2a, MD5S22);
204     MD5_STEP (MD5_H , b, c, d, a, w1_t[2], MD5C2b, MD5S23);
205     MD5_STEP (MD5_H , a, b, c, d, w2_t[1], MD5C2c, MD5S20);
206     MD5_STEP (MD5_H , d, a, b, c, w3_t[0], MD5C2d, MD5S21);
207     MD5_STEP (MD5_H , c, d, a, b, w3_t[3], MD5C2e, MD5S22);
208     MD5_STEP (MD5_H , b, c, d, a, w0_t[2], MD5C2f, MD5S23);
209
210     MD5_STEP (MD5_I , a, b, c, d, w0_t[0], MD5C30, MD5S30);
211     MD5_STEP (MD5_I , d, a, b, c, w1_t[3], MD5C31, MD5S31);
212     MD5_STEP (MD5_I , c, d, a, b, w3_t[2], MD5C32, MD5S32);
213     MD5_STEP (MD5_I , b, c, d, a, w1_t[1], MD5C33, MD5S33);
214     MD5_STEP (MD5_I , a, b, c, d, w3_t[0], MD5C34, MD5S30);
215     MD5_STEP (MD5_I , d, a, b, c, w0_t[3], MD5C35, MD5S31);
216     MD5_STEP (MD5_I , c, d, a, b, w2_t[2], MD5C36, MD5S32);
217     MD5_STEP (MD5_I , b, c, d, a, w0_t[1], MD5C37, MD5S33);
218     MD5_STEP (MD5_I , a, b, c, d, w2_t[0], MD5C38, MD5S30);
219     MD5_STEP (MD5_I , d, a, b, c, w3_t[3], MD5C39, MD5S31);
220     MD5_STEP (MD5_I , c, d, a, b, w1_t[2], MD5C3a, MD5S32);
221     MD5_STEP (MD5_I , b, c, d, a, w3_t[1], MD5C3b, MD5S33);
222     MD5_STEP (MD5_I , a, b, c, d, w1_t[0], MD5C3c, MD5S30);
223     MD5_STEP (MD5_I , d, a, b, c, w2_t[3], MD5C3d, MD5S31);
224     MD5_STEP (MD5_I , c, d, a, b, w0_t[2], MD5C3e, MD5S32);
225     MD5_STEP (MD5_I , b, c, d, a, w2_t[1], MD5C3f, MD5S33);
226
227     COMPARE_M_SIMD (a, d, c, b);
228   }
229 }
230
231 static void m04800s (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset)
232 {
233   /**
234    * modifier
235    */
236
237   const u32 gid = get_global_id (0);
238   const u32 lid = get_local_id (0);
239
240   /**
241    * salt
242    */
243
244   u32 salt_buf[5];
245
246   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
247   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
248   salt_buf[2] = salt_bufs[salt_pos].salt_buf[2];
249   salt_buf[3] = salt_bufs[salt_pos].salt_buf[3];
250   salt_buf[4] = salt_bufs[salt_pos].salt_buf[4];
251
252   const u32 salt_len = salt_bufs[salt_pos].salt_len;
253
254   const u32 pw_salt_len = pw_len + salt_len;
255
256   u32 s0[4];
257
258   s0[0] = salt_buf[0];
259   s0[1] = salt_buf[1];
260   s0[2] = salt_buf[2];
261   s0[3] = salt_buf[3];
262
263   u32 s1[4];
264
265   s1[0] = 0x80;
266   s1[1] = 0;
267   s1[2] = 0;
268   s1[3] = 0;
269
270   u32 s2[4];
271
272   s2[0] = 0;
273   s2[1] = 0;
274   s2[2] = 0;
275   s2[3] = 0;
276
277   u32 s3[4];
278
279   s3[0] = 0;
280   s3[1] = 0;
281   s3[2] = 0;
282   s3[3] = 0;
283
284   // move w by 1
285
286   u32x w0_t[4];
287
288   w0_t[0] = w0[0];
289   w0_t[1] = w0[1];
290   w0_t[2] = w0[2];
291   w0_t[3] = w0[3];
292
293   u32x w1_t[4];
294
295   w1_t[0] = w1[0];
296   w1_t[1] = w1[1];
297   w1_t[2] = w1[2];
298   w1_t[3] = w1[3];
299
300   u32x w2_t[4];
301
302   w2_t[0] = 0;
303   w2_t[1] = 0;
304   w2_t[2] = 0;
305   w2_t[3] = 0;
306
307   u32x w3_t[4];
308
309   w3_t[0] = 0;
310   w3_t[1] = 0;
311   w3_t[2] = 0;
312   w3_t[3] = 0;
313
314   switch_buffer_by_offset_le (w0_t, w1_t, w2_t, w3_t, 1);
315
316   switch_buffer_by_offset_le_S (s0, s1, s2, s3, 1 + pw_len);
317
318   w0_t[0] |= s0[0];
319   w0_t[1] |= s0[1];
320   w0_t[2] |= s0[2];
321   w0_t[3] |= s0[3];
322
323   w1_t[0] |= s1[0];
324   w1_t[1] |= s1[1];
325   w1_t[2] |= s1[2];
326   w1_t[3] |= s1[3];
327
328   w2_t[0] |= s2[0];
329   w2_t[1] |= s2[1];
330   w2_t[2] |= s2[2];
331   w2_t[3] |= s2[3];
332
333   w3_t[0] |= s3[0];
334   w3_t[1] |= s3[1];
335   w3_t[2]  = pw_salt_len * 8;
336   w3_t[3]  = 0;
337
338   /**
339    * add id byte
340    */
341
342   w0_t[0] |= salt_buf[4];
343
344   /**
345    * digest
346    */
347
348   const u32 search[4] =
349   {
350     digests_buf[digests_offset].digest_buf[DGST_R0],
351     digests_buf[digests_offset].digest_buf[DGST_R1],
352     digests_buf[digests_offset].digest_buf[DGST_R2],
353     digests_buf[digests_offset].digest_buf[DGST_R3]
354   };
355
356   /**
357    * loop
358    */
359
360   u32x w0l = w0_t[0];
361   u32x w1l = w0_t[1];
362
363   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
364   {
365     const u32x w0r = ix_create_bft (bfs_buf, il_pos);
366
367     w0_t[0] = w0l | (w0r <<  8);
368     w0_t[1] = w1l | (w0r >> 24);
369
370     /**
371      * md5
372      */
373
374     u32x a = MD5M_A;
375     u32x b = MD5M_B;
376     u32x c = MD5M_C;
377     u32x d = MD5M_D;
378
379     MD5_STEP (MD5_Fo, a, b, c, d, w0_t[0], MD5C00, MD5S00);
380     MD5_STEP (MD5_Fo, d, a, b, c, w0_t[1], MD5C01, MD5S01);
381     MD5_STEP (MD5_Fo, c, d, a, b, w0_t[2], MD5C02, MD5S02);
382     MD5_STEP (MD5_Fo, b, c, d, a, w0_t[3], MD5C03, MD5S03);
383     MD5_STEP (MD5_Fo, a, b, c, d, w1_t[0], MD5C04, MD5S00);
384     MD5_STEP (MD5_Fo, d, a, b, c, w1_t[1], MD5C05, MD5S01);
385     MD5_STEP (MD5_Fo, c, d, a, b, w1_t[2], MD5C06, MD5S02);
386     MD5_STEP (MD5_Fo, b, c, d, a, w1_t[3], MD5C07, MD5S03);
387     MD5_STEP (MD5_Fo, a, b, c, d, w2_t[0], MD5C08, MD5S00);
388     MD5_STEP (MD5_Fo, d, a, b, c, w2_t[1], MD5C09, MD5S01);
389     MD5_STEP (MD5_Fo, c, d, a, b, w2_t[2], MD5C0a, MD5S02);
390     MD5_STEP (MD5_Fo, b, c, d, a, w2_t[3], MD5C0b, MD5S03);
391     MD5_STEP (MD5_Fo, a, b, c, d, w3_t[0], MD5C0c, MD5S00);
392     MD5_STEP (MD5_Fo, d, a, b, c, w3_t[1], MD5C0d, MD5S01);
393     MD5_STEP (MD5_Fo, c, d, a, b, w3_t[2], MD5C0e, MD5S02);
394     MD5_STEP (MD5_Fo, b, c, d, a, w3_t[3], MD5C0f, MD5S03);
395
396     MD5_STEP (MD5_Go, a, b, c, d, w0_t[1], MD5C10, MD5S10);
397     MD5_STEP (MD5_Go, d, a, b, c, w1_t[2], MD5C11, MD5S11);
398     MD5_STEP (MD5_Go, c, d, a, b, w2_t[3], MD5C12, MD5S12);
399     MD5_STEP (MD5_Go, b, c, d, a, w0_t[0], MD5C13, MD5S13);
400     MD5_STEP (MD5_Go, a, b, c, d, w1_t[1], MD5C14, MD5S10);
401     MD5_STEP (MD5_Go, d, a, b, c, w2_t[2], MD5C15, MD5S11);
402     MD5_STEP (MD5_Go, c, d, a, b, w3_t[3], MD5C16, MD5S12);
403     MD5_STEP (MD5_Go, b, c, d, a, w1_t[0], MD5C17, MD5S13);
404     MD5_STEP (MD5_Go, a, b, c, d, w2_t[1], MD5C18, MD5S10);
405     MD5_STEP (MD5_Go, d, a, b, c, w3_t[2], MD5C19, MD5S11);
406     MD5_STEP (MD5_Go, c, d, a, b, w0_t[3], MD5C1a, MD5S12);
407     MD5_STEP (MD5_Go, b, c, d, a, w2_t[0], MD5C1b, MD5S13);
408     MD5_STEP (MD5_Go, a, b, c, d, w3_t[1], MD5C1c, MD5S10);
409     MD5_STEP (MD5_Go, d, a, b, c, w0_t[2], MD5C1d, MD5S11);
410     MD5_STEP (MD5_Go, c, d, a, b, w1_t[3], MD5C1e, MD5S12);
411     MD5_STEP (MD5_Go, b, c, d, a, w3_t[0], MD5C1f, MD5S13);
412
413     MD5_STEP (MD5_H , a, b, c, d, w1_t[1], MD5C20, MD5S20);
414     MD5_STEP (MD5_H , d, a, b, c, w2_t[0], MD5C21, MD5S21);
415     MD5_STEP (MD5_H , c, d, a, b, w2_t[3], MD5C22, MD5S22);
416     MD5_STEP (MD5_H , b, c, d, a, w3_t[2], MD5C23, MD5S23);
417     MD5_STEP (MD5_H , a, b, c, d, w0_t[1], MD5C24, MD5S20);
418     MD5_STEP (MD5_H , d, a, b, c, w1_t[0], MD5C25, MD5S21);
419     MD5_STEP (MD5_H , c, d, a, b, w1_t[3], MD5C26, MD5S22);
420     MD5_STEP (MD5_H , b, c, d, a, w2_t[2], MD5C27, MD5S23);
421     MD5_STEP (MD5_H , a, b, c, d, w3_t[1], MD5C28, MD5S20);
422     MD5_STEP (MD5_H , d, a, b, c, w0_t[0], MD5C29, MD5S21);
423     MD5_STEP (MD5_H , c, d, a, b, w0_t[3], MD5C2a, MD5S22);
424     MD5_STEP (MD5_H , b, c, d, a, w1_t[2], MD5C2b, MD5S23);
425     MD5_STEP (MD5_H , a, b, c, d, w2_t[1], MD5C2c, MD5S20);
426     MD5_STEP (MD5_H , d, a, b, c, w3_t[0], MD5C2d, MD5S21);
427     MD5_STEP (MD5_H , c, d, a, b, w3_t[3], MD5C2e, MD5S22);
428     MD5_STEP (MD5_H , b, c, d, a, w0_t[2], MD5C2f, MD5S23);
429
430     MD5_STEP (MD5_I , a, b, c, d, w0_t[0], MD5C30, MD5S30);
431     MD5_STEP (MD5_I , d, a, b, c, w1_t[3], MD5C31, MD5S31);
432     MD5_STEP (MD5_I , c, d, a, b, w3_t[2], MD5C32, MD5S32);
433     MD5_STEP (MD5_I , b, c, d, a, w1_t[1], MD5C33, MD5S33);
434     MD5_STEP (MD5_I , a, b, c, d, w3_t[0], MD5C34, MD5S30);
435     MD5_STEP (MD5_I , d, a, b, c, w0_t[3], MD5C35, MD5S31);
436     MD5_STEP (MD5_I , c, d, a, b, w2_t[2], MD5C36, MD5S32);
437     MD5_STEP (MD5_I , b, c, d, a, w0_t[1], MD5C37, MD5S33);
438     MD5_STEP (MD5_I , a, b, c, d, w2_t[0], MD5C38, MD5S30);
439     MD5_STEP (MD5_I , d, a, b, c, w3_t[3], MD5C39, MD5S31);
440     MD5_STEP (MD5_I , c, d, a, b, w1_t[2], MD5C3a, MD5S32);
441     MD5_STEP (MD5_I , b, c, d, a, w3_t[1], MD5C3b, MD5S33);
442     MD5_STEP (MD5_I , a, b, c, d, w1_t[0], MD5C3c, MD5S30);
443
444     if (MATCHES_NONE_VS (a, search[0])) continue;
445
446     MD5_STEP (MD5_I , d, a, b, c, w2_t[3], MD5C3d, MD5S31);
447     MD5_STEP (MD5_I , c, d, a, b, w0_t[2], MD5C3e, MD5S32);
448     MD5_STEP (MD5_I , b, c, d, a, w2_t[1], MD5C3f, MD5S33);
449
450     COMPARE_S_SIMD (a, d, c, b);
451   }
452 }
453
454 __kernel void m04800_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
455 {
456   /**
457    * base
458    */
459
460   const u32 gid = get_global_id (0);
461
462   if (gid >= gid_max) return;
463
464   /**
465    * modifier
466    */
467
468   const u32 lid = get_local_id (0);
469
470
471   u32 w0[4];
472
473   w0[0] = pws[gid].i[ 0];
474   w0[1] = pws[gid].i[ 1];
475   w0[2] = pws[gid].i[ 2];
476   w0[3] = pws[gid].i[ 3];
477
478   u32 w1[4];
479
480   w1[0] = 0;
481   w1[1] = 0;
482   w1[2] = 0;
483   w1[3] = 0;
484
485   u32 w2[4];
486
487   w2[0] = 0;
488   w2[1] = 0;
489   w2[2] = 0;
490   w2[3] = 0;
491
492   u32 w3[4];
493
494   w3[0] = 0;
495   w3[1] = 0;
496   w3[2] = 0;
497   w3[3] = 0;
498
499   const u32 pw_len = pws[gid].pw_len;
500
501   /**
502    * main
503    */
504
505   m04800m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
506 }
507
508 __kernel void m04800_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
509 {
510   /**
511    * base
512    */
513
514   const u32 gid = get_global_id (0);
515
516   if (gid >= gid_max) return;
517
518   /**
519    * modifier
520    */
521
522   const u32 lid = get_local_id (0);
523
524   u32 w0[4];
525
526   w0[0] = pws[gid].i[ 0];
527   w0[1] = pws[gid].i[ 1];
528   w0[2] = pws[gid].i[ 2];
529   w0[3] = pws[gid].i[ 3];
530
531   u32 w1[4];
532
533   w1[0] = pws[gid].i[ 4];
534   w1[1] = pws[gid].i[ 5];
535   w1[2] = pws[gid].i[ 6];
536   w1[3] = pws[gid].i[ 7];
537
538   u32 w2[4];
539
540   w2[0] = 0;
541   w2[1] = 0;
542   w2[2] = 0;
543   w2[3] = 0;
544
545   u32 w3[4];
546
547   w3[0] = 0;
548   w3[1] = 0;
549   w3[2] = 0;
550   w3[3] = 0;
551
552   const u32 pw_len = pws[gid].pw_len;
553
554   /**
555    * main
556    */
557
558   m04800m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
559 }
560
561 __kernel void m04800_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
562 {
563   /**
564    * base
565    */
566
567   const u32 gid = get_global_id (0);
568
569   if (gid >= gid_max) return;
570
571   /**
572    * modifier
573    */
574
575   const u32 lid = get_local_id (0);
576
577   u32 w0[4];
578
579   w0[0] = pws[gid].i[ 0];
580   w0[1] = pws[gid].i[ 1];
581   w0[2] = pws[gid].i[ 2];
582   w0[3] = pws[gid].i[ 3];
583
584   u32 w1[4];
585
586   w1[0] = pws[gid].i[ 4];
587   w1[1] = pws[gid].i[ 5];
588   w1[2] = pws[gid].i[ 6];
589   w1[3] = pws[gid].i[ 7];
590
591   u32 w2[4];
592
593   w2[0] = pws[gid].i[ 8];
594   w2[1] = pws[gid].i[ 9];
595   w2[2] = pws[gid].i[10];
596   w2[3] = pws[gid].i[11];
597
598   u32 w3[4];
599
600   w3[0] = pws[gid].i[12];
601   w3[1] = pws[gid].i[13];
602   w3[2] = pws[gid].i[14];
603   w3[3] = pws[gid].i[15];
604
605   const u32 pw_len = pws[gid].pw_len;
606
607   /**
608    * main
609    */
610
611   m04800m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
612 }
613
614 __kernel void m04800_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
615 {
616   /**
617    * base
618    */
619
620   const u32 gid = get_global_id (0);
621
622   if (gid >= gid_max) return;
623
624   /**
625    * modifier
626    */
627
628   const u32 lid = get_local_id (0);
629
630   u32 w0[4];
631
632   w0[0] = pws[gid].i[ 0];
633   w0[1] = pws[gid].i[ 1];
634   w0[2] = pws[gid].i[ 2];
635   w0[3] = pws[gid].i[ 3];
636
637   u32 w1[4];
638
639   w1[0] = 0;
640   w1[1] = 0;
641   w1[2] = 0;
642   w1[3] = 0;
643
644   u32 w2[4];
645
646   w2[0] = 0;
647   w2[1] = 0;
648   w2[2] = 0;
649   w2[3] = 0;
650
651   u32 w3[4];
652
653   w3[0] = 0;
654   w3[1] = 0;
655   w3[2] = 0;
656   w3[3] = 0;
657
658   const u32 pw_len = pws[gid].pw_len;
659
660   /**
661    * main
662    */
663
664   m04800s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
665 }
666
667 __kernel void m04800_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
668 {
669   /**
670    * base
671    */
672
673   const u32 gid = get_global_id (0);
674
675   if (gid >= gid_max) return;
676
677   /**
678    * modifier
679    */
680
681   const u32 lid = get_local_id (0);
682
683   u32 w0[4];
684
685   w0[0] = pws[gid].i[ 0];
686   w0[1] = pws[gid].i[ 1];
687   w0[2] = pws[gid].i[ 2];
688   w0[3] = pws[gid].i[ 3];
689
690   u32 w1[4];
691
692   w1[0] = pws[gid].i[ 4];
693   w1[1] = pws[gid].i[ 5];
694   w1[2] = pws[gid].i[ 6];
695   w1[3] = pws[gid].i[ 7];
696
697   u32 w2[4];
698
699   w2[0] = 0;
700   w2[1] = 0;
701   w2[2] = 0;
702   w2[3] = 0;
703
704   u32 w3[4];
705
706   w3[0] = 0;
707   w3[1] = 0;
708   w3[2] = 0;
709   w3[3] = 0;
710
711   const u32 pw_len = pws[gid].pw_len;
712
713   /**
714    * main
715    */
716
717   m04800s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
718 }
719
720 __kernel void m04800_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
721 {
722   /**
723    * base
724    */
725
726   const u32 gid = get_global_id (0);
727
728   if (gid >= gid_max) return;
729
730   /**
731    * modifier
732    */
733
734   const u32 lid = get_local_id (0);
735
736   u32 w0[4];
737
738   w0[0] = pws[gid].i[ 0];
739   w0[1] = pws[gid].i[ 1];
740   w0[2] = pws[gid].i[ 2];
741   w0[3] = pws[gid].i[ 3];
742
743   u32 w1[4];
744
745   w1[0] = pws[gid].i[ 4];
746   w1[1] = pws[gid].i[ 5];
747   w1[2] = pws[gid].i[ 6];
748   w1[3] = pws[gid].i[ 7];
749
750   u32 w2[4];
751
752   w2[0] = pws[gid].i[ 8];
753   w2[1] = pws[gid].i[ 9];
754   w2[2] = pws[gid].i[10];
755   w2[3] = pws[gid].i[11];
756
757   u32 w3[4];
758
759   w3[0] = pws[gid].i[12];
760   w3[1] = pws[gid].i[13];
761   w3[2] = pws[gid].i[14];
762   w3[3] = pws[gid].i[15];
763
764   const u32 pw_len = pws[gid].pw_len;
765
766   /**
767    * main
768    */
769
770   m04800s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, il_cnt, digests_cnt, digests_offset);
771 }