Fix m 60 a 0 by making modified variable non-const
[hashcat.git] / OpenCL / m10410_a1.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _MD5_
9
10 //too much register pressure
11 //#define NEW_SIMD_CODE
12
13 #include "inc_vendor.cl"
14 #include "inc_hash_constants.h"
15 #include "inc_hash_functions.cl"
16 #include "inc_types.cl"
17 #include "inc_common.cl"
18 #include "inc_simd.cl"
19
20 __constant u32 padding[8] =
21 {
22   0x5e4ebf28,
23   0x418a754e,
24   0x564e0064,
25   0x0801faff,
26   0xb6002e2e,
27   0x803e68d0,
28   0xfea90c2f,
29   0x7a695364
30 };
31
32 typedef struct
33 {
34   u8 S[256];
35
36   u32 wtf_its_faster;
37
38 } RC4_KEY;
39
40 void swap (__local RC4_KEY *rc4_key, const u8 i, const u8 j)
41 {
42   u8 tmp;
43
44   tmp           = rc4_key->S[i];
45   rc4_key->S[i] = rc4_key->S[j];
46   rc4_key->S[j] = tmp;
47 }
48
49 void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
50 {
51   u32 v = 0x03020100;
52   u32 a = 0x04040404;
53
54   __local u32 *ptr = (__local u32 *) rc4_key->S;
55
56   #ifdef _unroll
57   #pragma unroll
58   #endif
59   for (u32 i = 0; i < 64; i++)
60   {
61     ptr[i] = v; v += a;
62   }
63
64   const u32 d0 = data[0] >>  0;
65   const u32 d1 = data[0] >>  8;
66   const u32 d2 = data[0] >> 16;
67   const u32 d3 = data[0] >> 24;
68   const u32 d4 = data[1] >>  0;
69
70   u32 j = 0;
71
72   #ifdef _unroll
73   #pragma unroll
74   #endif
75   for (u32 i = 0; i < 255; i += 5)
76   {
77     j += rc4_key->S[i + 0] + d0; swap (rc4_key, i + 0, j);
78     j += rc4_key->S[i + 1] + d1; swap (rc4_key, i + 1, j);
79     j += rc4_key->S[i + 2] + d2; swap (rc4_key, i + 2, j);
80     j += rc4_key->S[i + 3] + d3; swap (rc4_key, i + 3, j);
81     j += rc4_key->S[i + 4] + d4; swap (rc4_key, i + 4, j);
82   }
83
84   j += rc4_key->S[255] + d0; swap (rc4_key, 255, j);
85 }
86
87 u8 rc4_next_16 (__local RC4_KEY *rc4_key, u8 i, u8 j, __constant u32 *in, u32 out[4])
88 {
89   #ifdef _unroll
90   #pragma unroll
91   #endif
92   for (u32 k = 0; k < 4; k++)
93   {
94     u32 xor4 = 0;
95
96     u8 idx;
97
98     i += 1;
99     j += rc4_key->S[i];
100
101     swap (rc4_key, i, j);
102
103     idx = rc4_key->S[i] + rc4_key->S[j];
104
105     xor4 |= rc4_key->S[idx] <<  0;
106
107     i += 1;
108     j += rc4_key->S[i];
109
110     swap (rc4_key, i, j);
111
112     idx = rc4_key->S[i] + rc4_key->S[j];
113
114     xor4 |= rc4_key->S[idx] <<  8;
115
116     i += 1;
117     j += rc4_key->S[i];
118
119     swap (rc4_key, i, j);
120
121     idx = rc4_key->S[i] + rc4_key->S[j];
122
123     xor4 |= rc4_key->S[idx] << 16;
124
125     i += 1;
126     j += rc4_key->S[i];
127
128     swap (rc4_key, i, j);
129
130     idx = rc4_key->S[i] + rc4_key->S[j];
131
132     xor4 |= rc4_key->S[idx] << 24;
133
134     out[k] = in[k] ^ xor4;
135   }
136
137   return j;
138 }
139
140 __kernel void m10410_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
141 {
142   /**
143    * modifier
144    */
145
146   const u32 lid = get_local_id (0);
147
148   /**
149    * base
150    */
151
152   const u32 gid = get_global_id (0);
153
154   if (gid >= gid_max) return;
155
156   u32 pw_buf0[4];
157   u32 pw_buf1[4];
158
159   pw_buf0[0] = pws[gid].i[0];
160   pw_buf0[1] = pws[gid].i[1];
161   pw_buf0[2] = pws[gid].i[2];
162   pw_buf0[3] = pws[gid].i[3];
163   pw_buf1[0] = pws[gid].i[4];
164   pw_buf1[1] = pws[gid].i[5];
165   pw_buf1[2] = pws[gid].i[6];
166   pw_buf1[3] = pws[gid].i[7];
167
168   const u32 pw_l_len = pws[gid].pw_len;
169
170   /**
171    * shared
172    */
173
174   __local RC4_KEY rc4_keys[64];
175
176   __local RC4_KEY *rc4_key = &rc4_keys[lid];
177
178   /**
179    * U_buf
180    */
181
182   u32 o_buf[8];
183
184   o_buf[0] = pdf_bufs[salt_pos].o_buf[0];
185   o_buf[1] = pdf_bufs[salt_pos].o_buf[1];
186   o_buf[2] = pdf_bufs[salt_pos].o_buf[2];
187   o_buf[3] = pdf_bufs[salt_pos].o_buf[3];
188   o_buf[4] = pdf_bufs[salt_pos].o_buf[4];
189   o_buf[5] = pdf_bufs[salt_pos].o_buf[5];
190   o_buf[6] = pdf_bufs[salt_pos].o_buf[6];
191   o_buf[7] = pdf_bufs[salt_pos].o_buf[7];
192
193   u32 P = pdf_bufs[salt_pos].P;
194
195   u32 id_buf[4];
196
197   id_buf[0] = pdf_bufs[salt_pos].id_buf[0];
198   id_buf[1] = pdf_bufs[salt_pos].id_buf[1];
199   id_buf[2] = pdf_bufs[salt_pos].id_buf[2];
200   id_buf[3] = pdf_bufs[salt_pos].id_buf[3];
201
202   /**
203    * loop
204    */
205
206   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
207   {
208     const u32x pw_r_len = pwlenx_create_combt (combs_buf, il_pos);
209
210     const u32x pw_len = pw_l_len + pw_r_len;
211
212     /**
213      * concat password candidate
214      */
215
216     u32x wordl0[4] = { 0 };
217     u32x wordl1[4] = { 0 };
218     u32x wordl2[4] = { 0 };
219     u32x wordl3[4] = { 0 };
220
221     wordl0[0] = pw_buf0[0];
222     wordl0[1] = pw_buf0[1];
223     wordl0[2] = pw_buf0[2];
224     wordl0[3] = pw_buf0[3];
225     wordl1[0] = pw_buf1[0];
226     wordl1[1] = pw_buf1[1];
227     wordl1[2] = pw_buf1[2];
228     wordl1[3] = pw_buf1[3];
229
230     u32x wordr0[4] = { 0 };
231     u32x wordr1[4] = { 0 };
232     u32x wordr2[4] = { 0 };
233     u32x wordr3[4] = { 0 };
234
235     wordr0[0] = ix_create_combt (combs_buf, il_pos, 0);
236     wordr0[1] = ix_create_combt (combs_buf, il_pos, 1);
237     wordr0[2] = ix_create_combt (combs_buf, il_pos, 2);
238     wordr0[3] = ix_create_combt (combs_buf, il_pos, 3);
239     wordr1[0] = ix_create_combt (combs_buf, il_pos, 4);
240     wordr1[1] = ix_create_combt (combs_buf, il_pos, 5);
241     wordr1[2] = ix_create_combt (combs_buf, il_pos, 6);
242     wordr1[3] = ix_create_combt (combs_buf, il_pos, 7);
243
244     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
245     {
246       switch_buffer_by_offset_le_VV (wordr0, wordr1, wordr2, wordr3, pw_l_len);
247     }
248     else
249     {
250       switch_buffer_by_offset_le_VV (wordl0, wordl1, wordl2, wordl3, pw_r_len);
251     }
252
253     u32x w0[4];
254
255     w0[0] = wordl0[0] | wordr0[0];
256     w0[1] = wordl0[1] | wordr0[1];
257     w0[2] = 0;
258     w0[3] = 0;
259
260     /**
261      * pdf
262      */
263
264     rc4_init_16 (rc4_key, w0);
265
266     u32 out[4];
267
268     rc4_next_16 (rc4_key, 0, 0, padding, out);
269
270     COMPARE_M_SIMD (out[0], out[1], out[2], out[3]);
271   }
272 }
273
274 __kernel void m10410_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
275 {
276 }
277
278 __kernel void m10410_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
279 {
280 }
281
282 __kernel void m10410_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
283 {
284   /**
285    * modifier
286    */
287
288   const u32 lid = get_local_id (0);
289
290   /**
291    * base
292    */
293
294   const u32 gid = get_global_id (0);
295
296   if (gid >= gid_max) return;
297
298   u32 pw_buf0[4];
299   u32 pw_buf1[4];
300
301   pw_buf0[0] = pws[gid].i[0];
302   pw_buf0[1] = pws[gid].i[1];
303   pw_buf0[2] = pws[gid].i[2];
304   pw_buf0[3] = pws[gid].i[3];
305   pw_buf1[0] = pws[gid].i[4];
306   pw_buf1[1] = pws[gid].i[5];
307   pw_buf1[2] = pws[gid].i[6];
308   pw_buf1[3] = pws[gid].i[7];
309
310   const u32 pw_l_len = pws[gid].pw_len;
311
312   /**
313    * shared
314    */
315
316   __local RC4_KEY rc4_keys[64];
317
318   __local RC4_KEY *rc4_key = &rc4_keys[lid];
319
320   /**
321    * U_buf
322    */
323
324   u32 o_buf[8];
325
326   o_buf[0] = pdf_bufs[salt_pos].o_buf[0];
327   o_buf[1] = pdf_bufs[salt_pos].o_buf[1];
328   o_buf[2] = pdf_bufs[salt_pos].o_buf[2];
329   o_buf[3] = pdf_bufs[salt_pos].o_buf[3];
330   o_buf[4] = pdf_bufs[salt_pos].o_buf[4];
331   o_buf[5] = pdf_bufs[salt_pos].o_buf[5];
332   o_buf[6] = pdf_bufs[salt_pos].o_buf[6];
333   o_buf[7] = pdf_bufs[salt_pos].o_buf[7];
334
335   u32 P = pdf_bufs[salt_pos].P;
336
337   u32 id_buf[4];
338
339   id_buf[0] = pdf_bufs[salt_pos].id_buf[0];
340   id_buf[1] = pdf_bufs[salt_pos].id_buf[1];
341   id_buf[2] = pdf_bufs[salt_pos].id_buf[2];
342   id_buf[3] = pdf_bufs[salt_pos].id_buf[3];
343
344   /**
345    * digest
346    */
347
348   const u32 search[4] =
349   {
350     digests_buf[digests_offset].digest_buf[DGST_R0],
351     digests_buf[digests_offset].digest_buf[DGST_R1],
352     digests_buf[digests_offset].digest_buf[DGST_R2],
353     digests_buf[digests_offset].digest_buf[DGST_R3]
354   };
355
356   /**
357    * loop
358    */
359
360   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
361   {
362     const u32x pw_r_len = pwlenx_create_combt (combs_buf, il_pos);
363
364     const u32x pw_len = pw_l_len + pw_r_len;
365
366     /**
367      * concat password candidate
368      */
369
370     u32x wordl0[4] = { 0 };
371     u32x wordl1[4] = { 0 };
372     u32x wordl2[4] = { 0 };
373     u32x wordl3[4] = { 0 };
374
375     wordl0[0] = pw_buf0[0];
376     wordl0[1] = pw_buf0[1];
377     wordl0[2] = pw_buf0[2];
378     wordl0[3] = pw_buf0[3];
379     wordl1[0] = pw_buf1[0];
380     wordl1[1] = pw_buf1[1];
381     wordl1[2] = pw_buf1[2];
382     wordl1[3] = pw_buf1[3];
383
384     u32x wordr0[4] = { 0 };
385     u32x wordr1[4] = { 0 };
386     u32x wordr2[4] = { 0 };
387     u32x wordr3[4] = { 0 };
388
389     wordr0[0] = ix_create_combt (combs_buf, il_pos, 0);
390     wordr0[1] = ix_create_combt (combs_buf, il_pos, 1);
391     wordr0[2] = ix_create_combt (combs_buf, il_pos, 2);
392     wordr0[3] = ix_create_combt (combs_buf, il_pos, 3);
393     wordr1[0] = ix_create_combt (combs_buf, il_pos, 4);
394     wordr1[1] = ix_create_combt (combs_buf, il_pos, 5);
395     wordr1[2] = ix_create_combt (combs_buf, il_pos, 6);
396     wordr1[3] = ix_create_combt (combs_buf, il_pos, 7);
397
398     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
399     {
400       switch_buffer_by_offset_le_VV (wordr0, wordr1, wordr2, wordr3, pw_l_len);
401     }
402     else
403     {
404       switch_buffer_by_offset_le_VV (wordl0, wordl1, wordl2, wordl3, pw_r_len);
405     }
406
407     u32x w0[4];
408
409     w0[0] = wordl0[0] | wordr0[0];
410     w0[1] = wordl0[1] | wordr0[1];
411     w0[2] = 0;
412     w0[3] = 0;
413
414     /**
415      * pdf
416      */
417
418     rc4_init_16 (rc4_key, w0);
419
420     u32 out[4];
421
422     rc4_next_16 (rc4_key, 0, 0, padding, out);
423
424     COMPARE_S_SIMD (out[0], out[1], out[2], out[3]);
425   }
426 }
427
428 __kernel void m10410_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
429 {
430 }
431
432 __kernel void m10410_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
433 {
434 }