- Dropped all vector code since new GPU's are all scalar, makes the code much easier
[hashcat.git] / OpenCL / m05300_a0.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _MD5_
7
8 #include "include/constants.h"
9 #include "include/kernel_vendor.h"
10
11 #define DGST_R0 0
12 #define DGST_R1 3
13 #define DGST_R2 2
14 #define DGST_R3 1
15
16 #include "include/kernel_functions.c"
17 #include "types_ocl.c"
18 #include "common.c"
19 #include "include/rp_gpu.h"
20 #include "rp.c"
21
22 #define COMPARE_S "check_single_comp4.c"
23 #define COMPARE_M "check_multi_comp4.c"
24
25 static void md5_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
26 {
27   u32 a = digest[0];
28   u32 b = digest[1];
29   u32 c = digest[2];
30   u32 d = digest[3];
31
32   u32 w0_t = w0[0];
33   u32 w1_t = w0[1];
34   u32 w2_t = w0[2];
35   u32 w3_t = w0[3];
36   u32 w4_t = w1[0];
37   u32 w5_t = w1[1];
38   u32 w6_t = w1[2];
39   u32 w7_t = w1[3];
40   u32 w8_t = w2[0];
41   u32 w9_t = w2[1];
42   u32 wa_t = w2[2];
43   u32 wb_t = w2[3];
44   u32 wc_t = w3[0];
45   u32 wd_t = w3[1];
46   u32 we_t = w3[2];
47   u32 wf_t = w3[3];
48
49   MD5_STEP (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
50   MD5_STEP (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
51   MD5_STEP (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
52   MD5_STEP (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
53   MD5_STEP (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
54   MD5_STEP (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
55   MD5_STEP (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
56   MD5_STEP (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
57   MD5_STEP (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
58   MD5_STEP (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
59   MD5_STEP (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
60   MD5_STEP (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
61   MD5_STEP (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
62   MD5_STEP (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
63   MD5_STEP (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
64   MD5_STEP (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
65
66   MD5_STEP (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
67   MD5_STEP (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
68   MD5_STEP (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
69   MD5_STEP (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
70   MD5_STEP (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
71   MD5_STEP (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
72   MD5_STEP (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
73   MD5_STEP (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
74   MD5_STEP (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
75   MD5_STEP (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
76   MD5_STEP (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
77   MD5_STEP (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
78   MD5_STEP (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
79   MD5_STEP (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
80   MD5_STEP (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
81   MD5_STEP (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
82
83   MD5_STEP (MD5_H , a, b, c, d, w5_t, MD5C20, MD5S20);
84   MD5_STEP (MD5_H , d, a, b, c, w8_t, MD5C21, MD5S21);
85   MD5_STEP (MD5_H , c, d, a, b, wb_t, MD5C22, MD5S22);
86   MD5_STEP (MD5_H , b, c, d, a, we_t, MD5C23, MD5S23);
87   MD5_STEP (MD5_H , a, b, c, d, w1_t, MD5C24, MD5S20);
88   MD5_STEP (MD5_H , d, a, b, c, w4_t, MD5C25, MD5S21);
89   MD5_STEP (MD5_H , c, d, a, b, w7_t, MD5C26, MD5S22);
90   MD5_STEP (MD5_H , b, c, d, a, wa_t, MD5C27, MD5S23);
91   MD5_STEP (MD5_H , a, b, c, d, wd_t, MD5C28, MD5S20);
92   MD5_STEP (MD5_H , d, a, b, c, w0_t, MD5C29, MD5S21);
93   MD5_STEP (MD5_H , c, d, a, b, w3_t, MD5C2a, MD5S22);
94   MD5_STEP (MD5_H , b, c, d, a, w6_t, MD5C2b, MD5S23);
95   MD5_STEP (MD5_H , a, b, c, d, w9_t, MD5C2c, MD5S20);
96   MD5_STEP (MD5_H , d, a, b, c, wc_t, MD5C2d, MD5S21);
97   MD5_STEP (MD5_H , c, d, a, b, wf_t, MD5C2e, MD5S22);
98   MD5_STEP (MD5_H , b, c, d, a, w2_t, MD5C2f, MD5S23);
99
100   MD5_STEP (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
101   MD5_STEP (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
102   MD5_STEP (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
103   MD5_STEP (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
104   MD5_STEP (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
105   MD5_STEP (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
106   MD5_STEP (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
107   MD5_STEP (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
108   MD5_STEP (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
109   MD5_STEP (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
110   MD5_STEP (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
111   MD5_STEP (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
112   MD5_STEP (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
113   MD5_STEP (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
114   MD5_STEP (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
115   MD5_STEP (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
116
117   digest[0] += a;
118   digest[1] += b;
119   digest[2] += c;
120   digest[3] += d;
121 }
122
123 static void hmac_md5_pad (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[4], u32 opad[4])
124 {
125   w0[0] = w0[0] ^ 0x36363636;
126   w0[1] = w0[1] ^ 0x36363636;
127   w0[2] = w0[2] ^ 0x36363636;
128   w0[3] = w0[3] ^ 0x36363636;
129   w1[0] = w1[0] ^ 0x36363636;
130   w1[1] = w1[1] ^ 0x36363636;
131   w1[2] = w1[2] ^ 0x36363636;
132   w1[3] = w1[3] ^ 0x36363636;
133   w2[0] = w2[0] ^ 0x36363636;
134   w2[1] = w2[1] ^ 0x36363636;
135   w2[2] = w2[2] ^ 0x36363636;
136   w2[3] = w2[3] ^ 0x36363636;
137   w3[0] = w3[0] ^ 0x36363636;
138   w3[1] = w3[1] ^ 0x36363636;
139   w3[2] = w3[2] ^ 0x36363636;
140   w3[3] = w3[3] ^ 0x36363636;
141
142   ipad[0] = MD5M_A;
143   ipad[1] = MD5M_B;
144   ipad[2] = MD5M_C;
145   ipad[3] = MD5M_D;
146
147   md5_transform (w0, w1, w2, w3, ipad);
148
149   w0[0] = w0[0] ^ 0x6a6a6a6a;
150   w0[1] = w0[1] ^ 0x6a6a6a6a;
151   w0[2] = w0[2] ^ 0x6a6a6a6a;
152   w0[3] = w0[3] ^ 0x6a6a6a6a;
153   w1[0] = w1[0] ^ 0x6a6a6a6a;
154   w1[1] = w1[1] ^ 0x6a6a6a6a;
155   w1[2] = w1[2] ^ 0x6a6a6a6a;
156   w1[3] = w1[3] ^ 0x6a6a6a6a;
157   w2[0] = w2[0] ^ 0x6a6a6a6a;
158   w2[1] = w2[1] ^ 0x6a6a6a6a;
159   w2[2] = w2[2] ^ 0x6a6a6a6a;
160   w2[3] = w2[3] ^ 0x6a6a6a6a;
161   w3[0] = w3[0] ^ 0x6a6a6a6a;
162   w3[1] = w3[1] ^ 0x6a6a6a6a;
163   w3[2] = w3[2] ^ 0x6a6a6a6a;
164   w3[3] = w3[3] ^ 0x6a6a6a6a;
165
166   opad[0] = MD5M_A;
167   opad[1] = MD5M_B;
168   opad[2] = MD5M_C;
169   opad[3] = MD5M_D;
170
171   md5_transform (w0, w1, w2, w3, opad);
172 }
173
174 static void hmac_md5_run (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[4], u32 opad[4], u32 digest[4])
175 {
176   digest[0] = ipad[0];
177   digest[1] = ipad[1];
178   digest[2] = ipad[2];
179   digest[3] = ipad[3];
180
181   md5_transform (w0, w1, w2, w3, digest);
182
183   w0[0] = digest[0];
184   w0[1] = digest[1];
185   w0[2] = digest[2];
186   w0[3] = digest[3];
187   w1[0] = 0x80;
188   w1[1] = 0;
189   w1[2] = 0;
190   w1[3] = 0;
191   w2[0] = 0;
192   w2[1] = 0;
193   w2[2] = 0;
194   w2[3] = 0;
195   w3[0] = 0;
196   w3[1] = 0;
197   w3[2] = (64 + 16) * 8;
198   w3[3] = 0;
199
200   digest[0] = opad[0];
201   digest[1] = opad[1];
202   digest[2] = opad[2];
203   digest[3] = opad[3];
204
205   md5_transform (w0, w1, w2, w3, digest);
206 }
207
208 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m05300_m04 (__global pw_t *pws, __global gpu_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
209 {
210   /**
211    * modifier
212    */
213
214   const u32 lid = get_local_id (0);
215
216   /**
217    * base
218    */
219
220   const u32 gid = get_global_id (0);
221
222   u32 pw_buf0[4];
223
224   pw_buf0[0] = pws[gid].i[ 0];
225   pw_buf0[1] = pws[gid].i[ 1];
226   pw_buf0[2] = pws[gid].i[ 2];
227   pw_buf0[3] = pws[gid].i[ 3];
228
229   u32 pw_buf1[4];
230
231   pw_buf1[0] = pws[gid].i[ 4];
232   pw_buf1[1] = pws[gid].i[ 5];
233   pw_buf1[2] = pws[gid].i[ 6];
234   pw_buf1[3] = pws[gid].i[ 7];
235
236   const u32 pw_len = pws[gid].pw_len;
237
238   /**
239    * salt
240    */
241
242   const u32 nr_len  = ikepsk_bufs[salt_pos].nr_len;
243   const u32 msg_len = ikepsk_bufs[salt_pos].msg_len;
244
245   u32 salt_buf0[4];
246
247   salt_buf0[0] = ikepsk_bufs[salt_pos].nr_buf[ 0];
248   salt_buf0[1] = ikepsk_bufs[salt_pos].nr_buf[ 1];
249   salt_buf0[2] = ikepsk_bufs[salt_pos].nr_buf[ 2];
250   salt_buf0[3] = ikepsk_bufs[salt_pos].nr_buf[ 3];
251
252   u32 salt_buf1[4];
253
254   salt_buf1[0] = ikepsk_bufs[salt_pos].nr_buf[ 4];
255   salt_buf1[1] = ikepsk_bufs[salt_pos].nr_buf[ 5];
256   salt_buf1[2] = ikepsk_bufs[salt_pos].nr_buf[ 6];
257   salt_buf1[3] = ikepsk_bufs[salt_pos].nr_buf[ 7];
258
259   u32 salt_buf2[4];
260
261   salt_buf2[0] = ikepsk_bufs[salt_pos].nr_buf[ 8];
262   salt_buf2[1] = ikepsk_bufs[salt_pos].nr_buf[ 9];
263   salt_buf2[2] = ikepsk_bufs[salt_pos].nr_buf[10];
264   salt_buf2[3] = ikepsk_bufs[salt_pos].nr_buf[11];
265
266   u32 salt_buf3[4];
267
268   salt_buf3[0] = ikepsk_bufs[salt_pos].nr_buf[12];
269   salt_buf3[1] = ikepsk_bufs[salt_pos].nr_buf[13];
270   salt_buf3[2] = 0;
271   salt_buf3[3] = 0;
272
273   __local u32 s_msg_buf[128];
274
275   const u32 lid2 = lid * 2;
276
277   s_msg_buf[lid2 + 0] = ikepsk_bufs[salt_pos].msg_buf[lid2 + 0];
278   s_msg_buf[lid2 + 1] = ikepsk_bufs[salt_pos].msg_buf[lid2 + 1];
279
280   barrier (CLK_LOCAL_MEM_FENCE);
281
282   if (gid >= gid_max) return;
283
284   /**
285    * loop
286    */
287
288   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
289   {
290     u32 w0[4];
291
292     w0[0] = pw_buf0[0];
293     w0[1] = pw_buf0[1];
294     w0[2] = pw_buf0[2];
295     w0[3] = pw_buf0[3];
296
297     u32 w1[4];
298
299     w1[0] = pw_buf1[0];
300     w1[1] = pw_buf1[1];
301     w1[2] = pw_buf1[2];
302     w1[3] = pw_buf1[3];
303
304     u32 w2[4];
305
306     w2[0] = 0;
307     w2[1] = 0;
308     w2[2] = 0;
309     w2[3] = 0;
310
311     u32 w3[4];
312
313     w3[0] = 0;
314     w3[1] = 0;
315     w3[2] = 0;
316     w3[3] = 0;
317
318     const u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
319
320     /**
321      * pads
322      */
323
324     u32 w0_t[4];
325
326     w0_t[0] = w0[0];
327     w0_t[1] = w0[1];
328     w0_t[2] = w0[2];
329     w0_t[3] = w0[3];
330
331     u32 w1_t[4];
332
333     w1_t[0] = w1[0];
334     w1_t[1] = w1[1];
335     w1_t[2] = w1[2];
336     w1_t[3] = w1[3];
337
338     u32 w2_t[4];
339
340     w2_t[0] = 0;
341     w2_t[1] = 0;
342     w2_t[2] = 0;
343     w2_t[3] = 0;
344
345     u32 w3_t[4];
346
347     w3_t[0] = 0;
348     w3_t[1] = 0;
349     w3_t[2] = 0;
350     w3_t[3] = 0;
351
352     u32 ipad[4];
353     u32 opad[4];
354
355     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
356
357     w0_t[0] = salt_buf0[0];
358     w0_t[1] = salt_buf0[1];
359     w0_t[2] = salt_buf0[2];
360     w0_t[3] = salt_buf0[3];
361     w1_t[0] = salt_buf1[0];
362     w1_t[1] = salt_buf1[1];
363     w1_t[2] = salt_buf1[2];
364     w1_t[3] = salt_buf1[3];
365     w2_t[0] = salt_buf2[0];
366     w2_t[1] = salt_buf2[1];
367     w2_t[2] = salt_buf2[2];
368     w2_t[3] = salt_buf2[3];
369     w3_t[0] = salt_buf3[0];
370     w3_t[1] = salt_buf3[1];
371     w3_t[2] = (64 + nr_len) * 8;
372     w3_t[3] = 0;
373
374     u32 digest[4];
375
376     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
377
378     w0_t[0] = digest[0];
379     w0_t[1] = digest[1];
380     w0_t[2] = digest[2];
381     w0_t[3] = digest[3];
382     w1_t[0] = 0;
383     w1_t[1] = 0;
384     w1_t[2] = 0;
385     w1_t[3] = 0;
386     w2_t[0] = 0;
387     w2_t[1] = 0;
388     w2_t[2] = 0;
389     w2_t[3] = 0;
390     w3_t[0] = 0;
391     w3_t[1] = 0;
392     w3_t[2] = 0;
393     w3_t[3] = 0;
394
395     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
396
397     int left;
398     int off;
399
400     for (left = ikepsk_bufs[salt_pos].msg_len, off = 0; left >= 56; left -= 64, off += 16)
401     {
402       w0_t[0] = s_msg_buf[off +  0];
403       w0_t[1] = s_msg_buf[off +  1];
404       w0_t[2] = s_msg_buf[off +  2];
405       w0_t[3] = s_msg_buf[off +  3];
406       w1_t[0] = s_msg_buf[off +  4];
407       w1_t[1] = s_msg_buf[off +  5];
408       w1_t[2] = s_msg_buf[off +  6];
409       w1_t[3] = s_msg_buf[off +  7];
410       w2_t[0] = s_msg_buf[off +  8];
411       w2_t[1] = s_msg_buf[off +  9];
412       w2_t[2] = s_msg_buf[off + 10];
413       w2_t[3] = s_msg_buf[off + 11];
414       w3_t[0] = s_msg_buf[off + 12];
415       w3_t[1] = s_msg_buf[off + 13];
416       w3_t[2] = s_msg_buf[off + 14];
417       w3_t[3] = s_msg_buf[off + 15];
418
419       md5_transform (w0_t, w1_t, w2_t, w3_t, ipad);
420     }
421
422     w0_t[0] = s_msg_buf[off +  0];
423     w0_t[1] = s_msg_buf[off +  1];
424     w0_t[2] = s_msg_buf[off +  2];
425     w0_t[3] = s_msg_buf[off +  3];
426     w1_t[0] = s_msg_buf[off +  4];
427     w1_t[1] = s_msg_buf[off +  5];
428     w1_t[2] = s_msg_buf[off +  6];
429     w1_t[3] = s_msg_buf[off +  7];
430     w2_t[0] = s_msg_buf[off +  8];
431     w2_t[1] = s_msg_buf[off +  9];
432     w2_t[2] = s_msg_buf[off + 10];
433     w2_t[3] = s_msg_buf[off + 11];
434     w3_t[0] = s_msg_buf[off + 12];
435     w3_t[1] = s_msg_buf[off + 13];
436     w3_t[2] = (64 + msg_len) * 8;
437     w3_t[3] = 0;
438
439     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
440
441     const u32 r0 = digest[0];
442     const u32 r1 = digest[3];
443     const u32 r2 = digest[2];
444     const u32 r3 = digest[1];
445
446     #include COMPARE_M
447   }
448 }
449
450 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m05300_m08 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
451 {
452 }
453
454 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m05300_m16 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
455 {
456 }
457
458 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m05300_s04 (__global pw_t *pws, __global gpu_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
459 {
460   /**
461    * modifier
462    */
463
464   const u32 lid = get_local_id (0);
465
466   /**
467    * base
468    */
469
470   const u32 gid = get_global_id (0);
471
472   u32 pw_buf0[4];
473
474   pw_buf0[0] = pws[gid].i[ 0];
475   pw_buf0[1] = pws[gid].i[ 1];
476   pw_buf0[2] = pws[gid].i[ 2];
477   pw_buf0[3] = pws[gid].i[ 3];
478
479   u32 pw_buf1[4];
480
481   pw_buf1[0] = pws[gid].i[ 4];
482   pw_buf1[1] = pws[gid].i[ 5];
483   pw_buf1[2] = pws[gid].i[ 6];
484   pw_buf1[3] = pws[gid].i[ 7];
485
486   const u32 pw_len = pws[gid].pw_len;
487
488   /**
489    * salt
490    */
491
492   const u32 nr_len  = ikepsk_bufs[salt_pos].nr_len;
493   const u32 msg_len = ikepsk_bufs[salt_pos].msg_len;
494
495   u32 salt_buf0[4];
496
497   salt_buf0[0] = ikepsk_bufs[salt_pos].nr_buf[ 0];
498   salt_buf0[1] = ikepsk_bufs[salt_pos].nr_buf[ 1];
499   salt_buf0[2] = ikepsk_bufs[salt_pos].nr_buf[ 2];
500   salt_buf0[3] = ikepsk_bufs[salt_pos].nr_buf[ 3];
501
502   u32 salt_buf1[4];
503
504   salt_buf1[0] = ikepsk_bufs[salt_pos].nr_buf[ 4];
505   salt_buf1[1] = ikepsk_bufs[salt_pos].nr_buf[ 5];
506   salt_buf1[2] = ikepsk_bufs[salt_pos].nr_buf[ 6];
507   salt_buf1[3] = ikepsk_bufs[salt_pos].nr_buf[ 7];
508
509   u32 salt_buf2[4];
510
511   salt_buf2[0] = ikepsk_bufs[salt_pos].nr_buf[ 8];
512   salt_buf2[1] = ikepsk_bufs[salt_pos].nr_buf[ 9];
513   salt_buf2[2] = ikepsk_bufs[salt_pos].nr_buf[10];
514   salt_buf2[3] = ikepsk_bufs[salt_pos].nr_buf[11];
515
516   u32 salt_buf3[4];
517
518   salt_buf3[0] = ikepsk_bufs[salt_pos].nr_buf[12];
519   salt_buf3[1] = ikepsk_bufs[salt_pos].nr_buf[13];
520   salt_buf3[2] = 0;
521   salt_buf3[3] = 0;
522
523   __local u32 s_msg_buf[128];
524
525   const u32 lid2 = lid * 2;
526
527   s_msg_buf[lid2 + 0] = ikepsk_bufs[salt_pos].msg_buf[lid2 + 0];
528   s_msg_buf[lid2 + 1] = ikepsk_bufs[salt_pos].msg_buf[lid2 + 1];
529
530   barrier (CLK_LOCAL_MEM_FENCE);
531
532   if (gid >= gid_max) return;
533
534   /**
535    * digest
536    */
537
538   const u32 search[4] =
539   {
540     digests_buf[digests_offset].digest_buf[DGST_R0],
541     digests_buf[digests_offset].digest_buf[DGST_R1],
542     digests_buf[digests_offset].digest_buf[DGST_R2],
543     digests_buf[digests_offset].digest_buf[DGST_R3]
544   };
545
546   /**
547    * loop
548    */
549
550   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
551   {
552     u32 w0[4];
553
554     w0[0] = pw_buf0[0];
555     w0[1] = pw_buf0[1];
556     w0[2] = pw_buf0[2];
557     w0[3] = pw_buf0[3];
558
559     u32 w1[4];
560
561     w1[0] = pw_buf1[0];
562     w1[1] = pw_buf1[1];
563     w1[2] = pw_buf1[2];
564     w1[3] = pw_buf1[3];
565
566     u32 w2[4];
567
568     w2[0] = 0;
569     w2[1] = 0;
570     w2[2] = 0;
571     w2[3] = 0;
572
573     u32 w3[4];
574
575     w3[0] = 0;
576     w3[1] = 0;
577     w3[2] = 0;
578     w3[3] = 0;
579
580     const u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
581
582     /**
583      * pads
584      */
585
586     u32 w0_t[4];
587
588     w0_t[0] = w0[0];
589     w0_t[1] = w0[1];
590     w0_t[2] = w0[2];
591     w0_t[3] = w0[3];
592
593     u32 w1_t[4];
594
595     w1_t[0] = w1[0];
596     w1_t[1] = w1[1];
597     w1_t[2] = w1[2];
598     w1_t[3] = w1[3];
599
600     u32 w2_t[4];
601
602     w2_t[0] = 0;
603     w2_t[1] = 0;
604     w2_t[2] = 0;
605     w2_t[3] = 0;
606
607     u32 w3_t[4];
608
609     w3_t[0] = 0;
610     w3_t[1] = 0;
611     w3_t[2] = 0;
612     w3_t[3] = 0;
613
614     u32 ipad[4];
615     u32 opad[4];
616
617     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
618
619     w0_t[0] = salt_buf0[0];
620     w0_t[1] = salt_buf0[1];
621     w0_t[2] = salt_buf0[2];
622     w0_t[3] = salt_buf0[3];
623     w1_t[0] = salt_buf1[0];
624     w1_t[1] = salt_buf1[1];
625     w1_t[2] = salt_buf1[2];
626     w1_t[3] = salt_buf1[3];
627     w2_t[0] = salt_buf2[0];
628     w2_t[1] = salt_buf2[1];
629     w2_t[2] = salt_buf2[2];
630     w2_t[3] = salt_buf2[3];
631     w3_t[0] = salt_buf3[0];
632     w3_t[1] = salt_buf3[1];
633     w3_t[2] = (64 + nr_len) * 8;
634     w3_t[3] = 0;
635
636     u32 digest[4];
637
638     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
639
640     w0_t[0] = digest[0];
641     w0_t[1] = digest[1];
642     w0_t[2] = digest[2];
643     w0_t[3] = digest[3];
644     w1_t[0] = 0;
645     w1_t[1] = 0;
646     w1_t[2] = 0;
647     w1_t[3] = 0;
648     w2_t[0] = 0;
649     w2_t[1] = 0;
650     w2_t[2] = 0;
651     w2_t[3] = 0;
652     w3_t[0] = 0;
653     w3_t[1] = 0;
654     w3_t[2] = 0;
655     w3_t[3] = 0;
656
657     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
658
659     int left;
660     int off;
661
662     for (left = ikepsk_bufs[salt_pos].msg_len, off = 0; left >= 56; left -= 64, off += 16)
663     {
664       w0_t[0] = s_msg_buf[off +  0];
665       w0_t[1] = s_msg_buf[off +  1];
666       w0_t[2] = s_msg_buf[off +  2];
667       w0_t[3] = s_msg_buf[off +  3];
668       w1_t[0] = s_msg_buf[off +  4];
669       w1_t[1] = s_msg_buf[off +  5];
670       w1_t[2] = s_msg_buf[off +  6];
671       w1_t[3] = s_msg_buf[off +  7];
672       w2_t[0] = s_msg_buf[off +  8];
673       w2_t[1] = s_msg_buf[off +  9];
674       w2_t[2] = s_msg_buf[off + 10];
675       w2_t[3] = s_msg_buf[off + 11];
676       w3_t[0] = s_msg_buf[off + 12];
677       w3_t[1] = s_msg_buf[off + 13];
678       w3_t[2] = s_msg_buf[off + 14];
679       w3_t[3] = s_msg_buf[off + 15];
680
681       md5_transform (w0_t, w1_t, w2_t, w3_t, ipad);
682     }
683
684     w0_t[0] = s_msg_buf[off +  0];
685     w0_t[1] = s_msg_buf[off +  1];
686     w0_t[2] = s_msg_buf[off +  2];
687     w0_t[3] = s_msg_buf[off +  3];
688     w1_t[0] = s_msg_buf[off +  4];
689     w1_t[1] = s_msg_buf[off +  5];
690     w1_t[2] = s_msg_buf[off +  6];
691     w1_t[3] = s_msg_buf[off +  7];
692     w2_t[0] = s_msg_buf[off +  8];
693     w2_t[1] = s_msg_buf[off +  9];
694     w2_t[2] = s_msg_buf[off + 10];
695     w2_t[3] = s_msg_buf[off + 11];
696     w3_t[0] = s_msg_buf[off + 12];
697     w3_t[1] = s_msg_buf[off + 13];
698     w3_t[2] = (64 + msg_len) * 8;
699     w3_t[3] = 0;
700
701     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
702
703     const u32 r0 = digest[0];
704     const u32 r1 = digest[3];
705     const u32 r2 = digest[2];
706     const u32 r3 = digest[1];
707
708     #include COMPARE_S
709   }
710 }
711
712 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m05300_s08 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
713 {
714 }
715
716 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m05300_s16 (__global pw_t *pws, __global gpu_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global ikepsk_t *ikepsk_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
717 {
718 }