Merge branch 'master' of https://github.com/hashcat/oclHashcat
[hashcat.git] / OpenCL / m05300_a3.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #include "include/constants.h"
9 #include "include/kernel_vendor.h"
10
11 #define DGST_R0 0
12 #define DGST_R1 3
13 #define DGST_R2 2
14 #define DGST_R3 1
15
16 #include "include/kernel_functions.c"
17 #include "OpenCL/types_ocl.c"
18 #include "OpenCL/common.c"
19
20 #define COMPARE_S "OpenCL/check_single_comp4.c"
21 #define COMPARE_M "OpenCL/check_multi_comp4.c"
22
23 static void md5_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
24 {
25   u32 a = digest[0];
26   u32 b = digest[1];
27   u32 c = digest[2];
28   u32 d = digest[3];
29
30   u32 w0_t = w0[0];
31   u32 w1_t = w0[1];
32   u32 w2_t = w0[2];
33   u32 w3_t = w0[3];
34   u32 w4_t = w1[0];
35   u32 w5_t = w1[1];
36   u32 w6_t = w1[2];
37   u32 w7_t = w1[3];
38   u32 w8_t = w2[0];
39   u32 w9_t = w2[1];
40   u32 wa_t = w2[2];
41   u32 wb_t = w2[3];
42   u32 wc_t = w3[0];
43   u32 wd_t = w3[1];
44   u32 we_t = w3[2];
45   u32 wf_t = w3[3];
46
47   MD5_STEP (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
48   MD5_STEP (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
49   MD5_STEP (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
50   MD5_STEP (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
51   MD5_STEP (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
52   MD5_STEP (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
53   MD5_STEP (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
54   MD5_STEP (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
55   MD5_STEP (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
56   MD5_STEP (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
57   MD5_STEP (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
58   MD5_STEP (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
59   MD5_STEP (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
60   MD5_STEP (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
61   MD5_STEP (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
62   MD5_STEP (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
63
64   MD5_STEP (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
65   MD5_STEP (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
66   MD5_STEP (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
67   MD5_STEP (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
68   MD5_STEP (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
69   MD5_STEP (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
70   MD5_STEP (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
71   MD5_STEP (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
72   MD5_STEP (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
73   MD5_STEP (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
74   MD5_STEP (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
75   MD5_STEP (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
76   MD5_STEP (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
77   MD5_STEP (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
78   MD5_STEP (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
79   MD5_STEP (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
80
81   MD5_STEP (MD5_H , a, b, c, d, w5_t, MD5C20, MD5S20);
82   MD5_STEP (MD5_H , d, a, b, c, w8_t, MD5C21, MD5S21);
83   MD5_STEP (MD5_H , c, d, a, b, wb_t, MD5C22, MD5S22);
84   MD5_STEP (MD5_H , b, c, d, a, we_t, MD5C23, MD5S23);
85   MD5_STEP (MD5_H , a, b, c, d, w1_t, MD5C24, MD5S20);
86   MD5_STEP (MD5_H , d, a, b, c, w4_t, MD5C25, MD5S21);
87   MD5_STEP (MD5_H , c, d, a, b, w7_t, MD5C26, MD5S22);
88   MD5_STEP (MD5_H , b, c, d, a, wa_t, MD5C27, MD5S23);
89   MD5_STEP (MD5_H , a, b, c, d, wd_t, MD5C28, MD5S20);
90   MD5_STEP (MD5_H , d, a, b, c, w0_t, MD5C29, MD5S21);
91   MD5_STEP (MD5_H , c, d, a, b, w3_t, MD5C2a, MD5S22);
92   MD5_STEP (MD5_H , b, c, d, a, w6_t, MD5C2b, MD5S23);
93   MD5_STEP (MD5_H , a, b, c, d, w9_t, MD5C2c, MD5S20);
94   MD5_STEP (MD5_H , d, a, b, c, wc_t, MD5C2d, MD5S21);
95   MD5_STEP (MD5_H , c, d, a, b, wf_t, MD5C2e, MD5S22);
96   MD5_STEP (MD5_H , b, c, d, a, w2_t, MD5C2f, MD5S23);
97
98   MD5_STEP (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
99   MD5_STEP (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
100   MD5_STEP (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
101   MD5_STEP (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
102   MD5_STEP (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
103   MD5_STEP (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
104   MD5_STEP (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
105   MD5_STEP (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
106   MD5_STEP (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
107   MD5_STEP (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
108   MD5_STEP (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
109   MD5_STEP (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
110   MD5_STEP (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
111   MD5_STEP (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
112   MD5_STEP (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
113   MD5_STEP (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
114
115   digest[0] += a;
116   digest[1] += b;
117   digest[2] += c;
118   digest[3] += d;
119 }
120
121 static void hmac_md5_pad (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[4], u32 opad[4])
122 {
123   w0[0] = w0[0] ^ 0x36363636;
124   w0[1] = w0[1] ^ 0x36363636;
125   w0[2] = w0[2] ^ 0x36363636;
126   w0[3] = w0[3] ^ 0x36363636;
127   w1[0] = w1[0] ^ 0x36363636;
128   w1[1] = w1[1] ^ 0x36363636;
129   w1[2] = w1[2] ^ 0x36363636;
130   w1[3] = w1[3] ^ 0x36363636;
131   w2[0] = w2[0] ^ 0x36363636;
132   w2[1] = w2[1] ^ 0x36363636;
133   w2[2] = w2[2] ^ 0x36363636;
134   w2[3] = w2[3] ^ 0x36363636;
135   w3[0] = w3[0] ^ 0x36363636;
136   w3[1] = w3[1] ^ 0x36363636;
137   w3[2] = w3[2] ^ 0x36363636;
138   w3[3] = w3[3] ^ 0x36363636;
139
140   ipad[0] = MD5M_A;
141   ipad[1] = MD5M_B;
142   ipad[2] = MD5M_C;
143   ipad[3] = MD5M_D;
144
145   md5_transform (w0, w1, w2, w3, ipad);
146
147   w0[0] = w0[0] ^ 0x6a6a6a6a;
148   w0[1] = w0[1] ^ 0x6a6a6a6a;
149   w0[2] = w0[2] ^ 0x6a6a6a6a;
150   w0[3] = w0[3] ^ 0x6a6a6a6a;
151   w1[0] = w1[0] ^ 0x6a6a6a6a;
152   w1[1] = w1[1] ^ 0x6a6a6a6a;
153   w1[2] = w1[2] ^ 0x6a6a6a6a;
154   w1[3] = w1[3] ^ 0x6a6a6a6a;
155   w2[0] = w2[0] ^ 0x6a6a6a6a;
156   w2[1] = w2[1] ^ 0x6a6a6a6a;
157   w2[2] = w2[2] ^ 0x6a6a6a6a;
158   w2[3] = w2[3] ^ 0x6a6a6a6a;
159   w3[0] = w3[0] ^ 0x6a6a6a6a;
160   w3[1] = w3[1] ^ 0x6a6a6a6a;
161   w3[2] = w3[2] ^ 0x6a6a6a6a;
162   w3[3] = w3[3] ^ 0x6a6a6a6a;
163
164   opad[0] = MD5M_A;
165   opad[1] = MD5M_B;
166   opad[2] = MD5M_C;
167   opad[3] = MD5M_D;
168
169   md5_transform (w0, w1, w2, w3, opad);
170 }
171
172 static void hmac_md5_run (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[4], u32 opad[4], u32 digest[4])
173 {
174   digest[0] = ipad[0];
175   digest[1] = ipad[1];
176   digest[2] = ipad[2];
177   digest[3] = ipad[3];
178
179   md5_transform (w0, w1, w2, w3, digest);
180
181   w0[0] = digest[0];
182   w0[1] = digest[1];
183   w0[2] = digest[2];
184   w0[3] = digest[3];
185   w1[0] = 0x80;
186   w1[1] = 0;
187   w1[2] = 0;
188   w1[3] = 0;
189   w2[0] = 0;
190   w2[1] = 0;
191   w2[2] = 0;
192   w2[3] = 0;
193   w3[0] = 0;
194   w3[1] = 0;
195   w3[2] = (64 + 16) * 8;
196   w3[3] = 0;
197
198   digest[0] = opad[0];
199   digest[1] = opad[1];
200   digest[2] = opad[2];
201   digest[3] = opad[3];
202
203   md5_transform (w0, w1, w2, w3, digest);
204 }
205
206 static void m05300m (__local u32 w_s[16], u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, __local u32 s_msg_buf[128])
207 {
208   /**
209    * modifier
210    */
211
212   const u32 gid = get_global_id (0);
213   const u32 lid = get_local_id (0);
214
215   /**
216    * salt
217    */
218
219   const u32 nr_len  = ikepsk_bufs[salt_pos].nr_len;
220   const u32 msg_len = ikepsk_bufs[salt_pos].msg_len;
221
222   /**
223    * loop
224    */
225
226   u32 w0l = w0[0];
227
228   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos++)
229   {
230     const u32 w0r = bfs_buf[il_pos].i;
231
232     w0[0] = w0l | w0r;
233
234     /**
235      * pads
236      */
237
238     u32 w0_t[4];
239
240     w0_t[0] = w0[0];
241     w0_t[1] = w0[1];
242     w0_t[2] = w0[2];
243     w0_t[3] = w0[3];
244
245     u32 w1_t[4];
246
247     w1_t[0] = w1[0];
248     w1_t[1] = w1[1];
249     w1_t[2] = w1[2];
250     w1_t[3] = w1[3];
251
252     u32 w2_t[4];
253
254     w2_t[0] = w2[0];
255     w2_t[1] = w2[1];
256     w2_t[2] = w2[2];
257     w2_t[3] = w2[3];
258
259     u32 w3_t[4];
260
261     w3_t[0] = w3[0];
262     w3_t[1] = w3[1];
263     w3_t[2] = w3[2];
264     w3_t[3] = w3[3];
265
266     u32 ipad[4];
267     u32 opad[4];
268
269     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
270
271     w0_t[0] = w_s[ 0];
272     w0_t[1] = w_s[ 1];
273     w0_t[2] = w_s[ 2];
274     w0_t[3] = w_s[ 3];
275     w1_t[0] = w_s[ 4];
276     w1_t[1] = w_s[ 5];
277     w1_t[2] = w_s[ 6];
278     w1_t[3] = w_s[ 7];
279     w2_t[0] = w_s[ 8];
280     w2_t[1] = w_s[ 9];
281     w2_t[2] = w_s[10];
282     w2_t[3] = w_s[11];
283     w3_t[0] = w_s[12];
284     w3_t[1] = w_s[13];
285     w3_t[2] = (64 + nr_len) * 8;
286     w3_t[3] = 0;
287
288     u32 digest[4];
289
290     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
291
292     w0_t[0] = digest[0];
293     w0_t[1] = digest[1];
294     w0_t[2] = digest[2];
295     w0_t[3] = digest[3];
296     w1_t[0] = 0;
297     w1_t[1] = 0;
298     w1_t[2] = 0;
299     w1_t[3] = 0;
300     w2_t[0] = 0;
301     w2_t[1] = 0;
302     w2_t[2] = 0;
303     w2_t[3] = 0;
304     w3_t[0] = 0;
305     w3_t[1] = 0;
306     w3_t[2] = 0;
307     w3_t[3] = 0;
308
309     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
310
311     int left;
312     int off;
313
314     for (left = ikepsk_bufs[salt_pos].msg_len, off = 0; left >= 56; left -= 64, off += 16)
315     {
316       w0_t[0] = s_msg_buf[off +  0];
317       w0_t[1] = s_msg_buf[off +  1];
318       w0_t[2] = s_msg_buf[off +  2];
319       w0_t[3] = s_msg_buf[off +  3];
320       w1_t[0] = s_msg_buf[off +  4];
321       w1_t[1] = s_msg_buf[off +  5];
322       w1_t[2] = s_msg_buf[off +  6];
323       w1_t[3] = s_msg_buf[off +  7];
324       w2_t[0] = s_msg_buf[off +  8];
325       w2_t[1] = s_msg_buf[off +  9];
326       w2_t[2] = s_msg_buf[off + 10];
327       w2_t[3] = s_msg_buf[off + 11];
328       w3_t[0] = s_msg_buf[off + 12];
329       w3_t[1] = s_msg_buf[off + 13];
330       w3_t[2] = s_msg_buf[off + 14];
331       w3_t[3] = s_msg_buf[off + 15];
332
333       md5_transform (w0_t, w1_t, w2_t, w3_t, ipad);
334     }
335
336     w0_t[0] = s_msg_buf[off +  0];
337     w0_t[1] = s_msg_buf[off +  1];
338     w0_t[2] = s_msg_buf[off +  2];
339     w0_t[3] = s_msg_buf[off +  3];
340     w1_t[0] = s_msg_buf[off +  4];
341     w1_t[1] = s_msg_buf[off +  5];
342     w1_t[2] = s_msg_buf[off +  6];
343     w1_t[3] = s_msg_buf[off +  7];
344     w2_t[0] = s_msg_buf[off +  8];
345     w2_t[1] = s_msg_buf[off +  9];
346     w2_t[2] = s_msg_buf[off + 10];
347     w2_t[3] = s_msg_buf[off + 11];
348     w3_t[0] = s_msg_buf[off + 12];
349     w3_t[1] = s_msg_buf[off + 13];
350     w3_t[2] = (64 + msg_len) * 8;
351     w3_t[3] = 0;
352
353     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
354
355     const u32 r0 = digest[0];
356     const u32 r1 = digest[3];
357     const u32 r2 = digest[2];
358     const u32 r3 = digest[1];
359
360     #include COMPARE_M
361   }
362 }
363
364 static void m05300s (__local u32 w_s[16], u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, __local u32 s_msg_buf[128])
365 {
366   /**
367    * modifier
368    */
369
370   const u32 gid = get_global_id (0);
371   const u32 lid = get_local_id (0);
372
373   /**
374    * salt
375    */
376
377   const u32 nr_len  = ikepsk_bufs[salt_pos].nr_len;
378   const u32 msg_len = ikepsk_bufs[salt_pos].msg_len;
379
380   /**
381    * digest
382    */
383
384   const u32 search[4] =
385   {
386     digests_buf[digests_offset].digest_buf[DGST_R0],
387     digests_buf[digests_offset].digest_buf[DGST_R1],
388     digests_buf[digests_offset].digest_buf[DGST_R2],
389     digests_buf[digests_offset].digest_buf[DGST_R3]
390   };
391
392   /**
393    * loop
394    */
395
396   u32 w0l = w0[0];
397
398   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos++)
399   {
400     const u32 w0r = bfs_buf[il_pos].i;
401
402     w0[0] = w0l | w0r;
403
404     /**
405      * pads
406      */
407
408     u32 w0_t[4];
409
410     w0_t[0] = w0[0];
411     w0_t[1] = w0[1];
412     w0_t[2] = w0[2];
413     w0_t[3] = w0[3];
414
415     u32 w1_t[4];
416
417     w1_t[0] = w1[0];
418     w1_t[1] = w1[1];
419     w1_t[2] = w1[2];
420     w1_t[3] = w1[3];
421
422     u32 w2_t[4];
423
424     w2_t[0] = w2[0];
425     w2_t[1] = w2[1];
426     w2_t[2] = w2[2];
427     w2_t[3] = w2[3];
428
429     u32 w3_t[4];
430
431     w3_t[0] = w3[0];
432     w3_t[1] = w3[1];
433     w3_t[2] = w3[2];
434     w3_t[3] = w3[3];
435
436     u32 ipad[4];
437     u32 opad[4];
438
439     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
440
441     w0_t[0] = w_s[ 0];
442     w0_t[1] = w_s[ 1];
443     w0_t[2] = w_s[ 2];
444     w0_t[3] = w_s[ 3];
445     w1_t[0] = w_s[ 4];
446     w1_t[1] = w_s[ 5];
447     w1_t[2] = w_s[ 6];
448     w1_t[3] = w_s[ 7];
449     w2_t[0] = w_s[ 8];
450     w2_t[1] = w_s[ 9];
451     w2_t[2] = w_s[10];
452     w2_t[3] = w_s[11];
453     w3_t[0] = w_s[12];
454     w3_t[1] = w_s[13];
455     w3_t[2] = (64 + nr_len) * 8;
456     w3_t[3] = 0;
457
458     u32 digest[4];
459
460     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
461
462     w0_t[0] = digest[0];
463     w0_t[1] = digest[1];
464     w0_t[2] = digest[2];
465     w0_t[3] = digest[3];
466     w1_t[0] = 0;
467     w1_t[1] = 0;
468     w1_t[2] = 0;
469     w1_t[3] = 0;
470     w2_t[0] = 0;
471     w2_t[1] = 0;
472     w2_t[2] = 0;
473     w2_t[3] = 0;
474     w3_t[0] = 0;
475     w3_t[1] = 0;
476     w3_t[2] = 0;
477     w3_t[3] = 0;
478
479     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
480
481     int left;
482     int off;
483
484     for (left = ikepsk_bufs[salt_pos].msg_len, off = 0; left >= 56; left -= 64, off += 16)
485     {
486       w0_t[0] = s_msg_buf[off +  0];
487       w0_t[1] = s_msg_buf[off +  1];
488       w0_t[2] = s_msg_buf[off +  2];
489       w0_t[3] = s_msg_buf[off +  3];
490       w1_t[0] = s_msg_buf[off +  4];
491       w1_t[1] = s_msg_buf[off +  5];
492       w1_t[2] = s_msg_buf[off +  6];
493       w1_t[3] = s_msg_buf[off +  7];
494       w2_t[0] = s_msg_buf[off +  8];
495       w2_t[1] = s_msg_buf[off +  9];
496       w2_t[2] = s_msg_buf[off + 10];
497       w2_t[3] = s_msg_buf[off + 11];
498       w3_t[0] = s_msg_buf[off + 12];
499       w3_t[1] = s_msg_buf[off + 13];
500       w3_t[2] = s_msg_buf[off + 14];
501       w3_t[3] = s_msg_buf[off + 15];
502
503       md5_transform (w0_t, w1_t, w2_t, w3_t, ipad);
504     }
505
506     w0_t[0] = s_msg_buf[off +  0];
507     w0_t[1] = s_msg_buf[off +  1];
508     w0_t[2] = s_msg_buf[off +  2];
509     w0_t[3] = s_msg_buf[off +  3];
510     w1_t[0] = s_msg_buf[off +  4];
511     w1_t[1] = s_msg_buf[off +  5];
512     w1_t[2] = s_msg_buf[off +  6];
513     w1_t[3] = s_msg_buf[off +  7];
514     w2_t[0] = s_msg_buf[off +  8];
515     w2_t[1] = s_msg_buf[off +  9];
516     w2_t[2] = s_msg_buf[off + 10];
517     w2_t[3] = s_msg_buf[off + 11];
518     w3_t[0] = s_msg_buf[off + 12];
519     w3_t[1] = s_msg_buf[off + 13];
520     w3_t[2] = (64 + msg_len) * 8;
521     w3_t[3] = 0;
522
523     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
524
525     const u32 r0 = digest[0];
526     const u32 r1 = digest[3];
527     const u32 r2 = digest[2];
528     const u32 r3 = digest[1];
529
530     #include COMPARE_S
531   }
532 }
533
534 __kernel void m05300_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
535 {
536   /**
537    * modifier
538    */
539
540   const u32 gid = get_global_id (0);
541   const u32 lid = get_local_id (0);
542   const u32 lsz = get_local_size (0);
543
544   /**
545    * s_msg
546    */
547
548   __local u32 w_s[16];
549
550   for (u32 i = lid; i < 16; i += lsz)
551   {
552     w_s[i] = ikepsk_bufs[salt_pos].nr_buf[i];
553   }
554
555   barrier (CLK_LOCAL_MEM_FENCE);
556
557   __local u32 s_msg_buf[128];
558
559   for (u32 i = lid; i < 128; i += lsz)
560   {
561     s_msg_buf[i] = ikepsk_bufs[salt_pos].msg_buf[i];
562   }
563
564   barrier (CLK_LOCAL_MEM_FENCE);
565
566   if (gid >= gid_max) return;
567
568   /**
569    * base
570    */
571
572   u32 w0[4];
573
574   w0[0] = pws[gid].i[ 0];
575   w0[1] = pws[gid].i[ 1];
576   w0[2] = pws[gid].i[ 2];
577   w0[3] = pws[gid].i[ 3];
578
579   u32 w1[4];
580
581   w1[0] = 0;
582   w1[1] = 0;
583   w1[2] = 0;
584   w1[3] = 0;
585
586   u32 w2[4];
587
588   w2[0] = 0;
589   w2[1] = 0;
590   w2[2] = 0;
591   w2[3] = 0;
592
593   u32 w3[4];
594
595   w3[0] = 0;
596   w3[1] = 0;
597   w3[2] = 0;
598   w3[3] = 0;
599
600   const u32 pw_len = pws[gid].pw_len;
601
602   /**
603    * main
604    */
605
606   m05300m (w_s, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
607 }
608
609 __kernel void m05300_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
610 {
611   /**
612    * modifier
613    */
614
615   const u32 gid = get_global_id (0);
616   const u32 lid = get_local_id (0);
617   const u32 lsz = get_local_size (0);
618
619   /**
620    * s_msg
621    */
622
623   __local u32 w_s[16];
624
625   for (u32 i = lid; i < 16; i += lsz)
626   {
627     w_s[i] = ikepsk_bufs[salt_pos].nr_buf[i];
628   }
629
630   barrier (CLK_LOCAL_MEM_FENCE);
631
632   __local u32 s_msg_buf[128];
633
634   for (u32 i = lid; i < 128; i += lsz)
635   {
636     s_msg_buf[i] = ikepsk_bufs[salt_pos].msg_buf[i];
637   }
638
639   barrier (CLK_LOCAL_MEM_FENCE);
640
641   if (gid >= gid_max) return;
642
643   /**
644    * base
645    */
646
647   u32 w0[4];
648
649   w0[0] = pws[gid].i[ 0];
650   w0[1] = pws[gid].i[ 1];
651   w0[2] = pws[gid].i[ 2];
652   w0[3] = pws[gid].i[ 3];
653
654   u32 w1[4];
655
656   w1[0] = pws[gid].i[ 4];
657   w1[1] = pws[gid].i[ 5];
658   w1[2] = pws[gid].i[ 6];
659   w1[3] = pws[gid].i[ 7];
660
661   u32 w2[4];
662
663   w2[0] = 0;
664   w2[1] = 0;
665   w2[2] = 0;
666   w2[3] = 0;
667
668   u32 w3[4];
669
670   w3[0] = 0;
671   w3[1] = 0;
672   w3[2] = 0;
673   w3[3] = 0;
674
675   const u32 pw_len = pws[gid].pw_len;
676
677   /**
678    * main
679    */
680
681   m05300m (w_s, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
682 }
683
684 __kernel void m05300_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
685 {
686   /**
687    * modifier
688    */
689
690   const u32 gid = get_global_id (0);
691   const u32 lid = get_local_id (0);
692   const u32 lsz = get_local_size (0);
693
694   /**
695    * s_msg
696    */
697
698   __local u32 w_s[16];
699
700   for (u32 i = lid; i < 16; i += lsz)
701   {
702     w_s[i] = ikepsk_bufs[salt_pos].nr_buf[i];
703   }
704
705   barrier (CLK_LOCAL_MEM_FENCE);
706
707   __local u32 s_msg_buf[128];
708
709   for (u32 i = lid; i < 128; i += lsz)
710   {
711     s_msg_buf[i] = ikepsk_bufs[salt_pos].msg_buf[i];
712   }
713
714   barrier (CLK_LOCAL_MEM_FENCE);
715
716   if (gid >= gid_max) return;
717
718   /**
719    * base
720    */
721
722   u32 w0[4];
723
724   w0[0] = pws[gid].i[ 0];
725   w0[1] = pws[gid].i[ 1];
726   w0[2] = pws[gid].i[ 2];
727   w0[3] = pws[gid].i[ 3];
728
729   u32 w1[4];
730
731   w1[0] = pws[gid].i[ 4];
732   w1[1] = pws[gid].i[ 5];
733   w1[2] = pws[gid].i[ 6];
734   w1[3] = pws[gid].i[ 7];
735
736   u32 w2[4];
737
738   w2[0] = pws[gid].i[ 8];
739   w2[1] = pws[gid].i[ 9];
740   w2[2] = pws[gid].i[10];
741   w2[3] = pws[gid].i[11];
742
743   u32 w3[4];
744
745   w3[0] = pws[gid].i[12];
746   w3[1] = pws[gid].i[13];
747   w3[2] = 0;
748   w3[3] = 0;
749
750   const u32 pw_len = pws[gid].pw_len;
751
752   /**
753    * main
754    */
755
756   m05300m (w_s, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
757 }
758
759 __kernel void m05300_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
760 {
761   /**
762    * modifier
763    */
764
765   const u32 gid = get_global_id (0);
766   const u32 lid = get_local_id (0);
767   const u32 lsz = get_local_size (0);
768
769   /**
770    * s_msg
771    */
772
773   __local u32 w_s[16];
774
775   for (u32 i = lid; i < 16; i += lsz)
776   {
777     w_s[i] = ikepsk_bufs[salt_pos].nr_buf[i];
778   }
779
780   barrier (CLK_LOCAL_MEM_FENCE);
781
782   __local u32 s_msg_buf[128];
783
784   for (u32 i = lid; i < 128; i += lsz)
785   {
786     s_msg_buf[i] = ikepsk_bufs[salt_pos].msg_buf[i];
787   }
788
789   barrier (CLK_LOCAL_MEM_FENCE);
790
791   if (gid >= gid_max) return;
792
793   /**
794    * base
795    */
796
797   u32 w0[4];
798
799   w0[0] = pws[gid].i[ 0];
800   w0[1] = pws[gid].i[ 1];
801   w0[2] = pws[gid].i[ 2];
802   w0[3] = pws[gid].i[ 3];
803
804   u32 w1[4];
805
806   w1[0] = 0;
807   w1[1] = 0;
808   w1[2] = 0;
809   w1[3] = 0;
810
811   u32 w2[4];
812
813   w2[0] = 0;
814   w2[1] = 0;
815   w2[2] = 0;
816   w2[3] = 0;
817
818   u32 w3[4];
819
820   w3[0] = 0;
821   w3[1] = 0;
822   w3[2] = 0;
823   w3[3] = 0;
824
825   const u32 pw_len = pws[gid].pw_len;
826
827   /**
828    * main
829    */
830
831   m05300s (w_s, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
832 }
833
834 __kernel void m05300_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
835 {
836   /**
837    * modifier
838    */
839
840   const u32 gid = get_global_id (0);
841   const u32 lid = get_local_id (0);
842   const u32 lsz = get_local_size (0);
843
844   /**
845    * s_msg
846    */
847
848   __local u32 w_s[16];
849
850   for (u32 i = lid; i < 16; i += lsz)
851   {
852     w_s[i] = ikepsk_bufs[salt_pos].nr_buf[i];
853   }
854
855   barrier (CLK_LOCAL_MEM_FENCE);
856
857   __local u32 s_msg_buf[128];
858
859   for (u32 i = lid; i < 128; i += lsz)
860   {
861     s_msg_buf[i] = ikepsk_bufs[salt_pos].msg_buf[i];
862   }
863
864   barrier (CLK_LOCAL_MEM_FENCE);
865
866   if (gid >= gid_max) return;
867
868   /**
869    * base
870    */
871
872   u32 w0[4];
873
874   w0[0] = pws[gid].i[ 0];
875   w0[1] = pws[gid].i[ 1];
876   w0[2] = pws[gid].i[ 2];
877   w0[3] = pws[gid].i[ 3];
878
879   u32 w1[4];
880
881   w1[0] = pws[gid].i[ 4];
882   w1[1] = pws[gid].i[ 5];
883   w1[2] = pws[gid].i[ 6];
884   w1[3] = pws[gid].i[ 7];
885
886   u32 w2[4];
887
888   w2[0] = 0;
889   w2[1] = 0;
890   w2[2] = 0;
891   w2[3] = 0;
892
893   u32 w3[4];
894
895   w3[0] = 0;
896   w3[1] = 0;
897   w3[2] = 0;
898   w3[3] = 0;
899
900   const u32 pw_len = pws[gid].pw_len;
901
902   /**
903    * main
904    */
905
906   m05300s (w_s, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
907 }
908
909 __kernel void m05300_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
910 {
911   /**
912    * modifier
913    */
914
915   const u32 gid = get_global_id (0);
916   const u32 lid = get_local_id (0);
917   const u32 lsz = get_local_size (0);
918
919   /**
920    * s_msg
921    */
922
923   __local u32 w_s[16];
924
925   for (u32 i = lid; i < 16; i += lsz)
926   {
927     w_s[i] = ikepsk_bufs[salt_pos].nr_buf[i];
928   }
929
930   barrier (CLK_LOCAL_MEM_FENCE);
931
932   __local u32 s_msg_buf[128];
933
934   for (u32 i = lid; i < 128; i += lsz)
935   {
936     s_msg_buf[i] = ikepsk_bufs[salt_pos].msg_buf[i];
937   }
938
939   barrier (CLK_LOCAL_MEM_FENCE);
940
941   if (gid >= gid_max) return;
942
943   /**
944    * base
945    */
946
947   u32 w0[4];
948
949   w0[0] = pws[gid].i[ 0];
950   w0[1] = pws[gid].i[ 1];
951   w0[2] = pws[gid].i[ 2];
952   w0[3] = pws[gid].i[ 3];
953
954   u32 w1[4];
955
956   w1[0] = pws[gid].i[ 4];
957   w1[1] = pws[gid].i[ 5];
958   w1[2] = pws[gid].i[ 6];
959   w1[3] = pws[gid].i[ 7];
960
961   u32 w2[4];
962
963   w2[0] = pws[gid].i[ 8];
964   w2[1] = pws[gid].i[ 9];
965   w2[2] = pws[gid].i[10];
966   w2[3] = pws[gid].i[11];
967
968   u32 w3[4];
969
970   w3[0] = pws[gid].i[12];
971   w3[1] = pws[gid].i[13];
972   w3[2] = 0;
973   w3[3] = 0;
974
975   const u32 pw_len = pws[gid].pw_len;
976
977   /**
978    * main
979    */
980
981   m05300s (w_s, w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
982 }