c5933efd186089b675a3d4547b84a45943a474bf
[hashcat.git] / OpenCL / m10410_a1.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _MD5_
9
10 //too much register pressure
11 //#define NEW_SIMD_CODE
12
13 #include "inc_hash_constants.h"
14 #include "inc_vendor.cl"
15
16 #define DGST_R0 0
17 #define DGST_R1 1
18 #define DGST_R2 2
19 #define DGST_R3 3
20
21 #include "inc_hash_functions.cl"
22 #include "inc_types.cl"
23 #include "inc_common.cl"
24 #include "inc_simd.cl"
25
26 __constant u32 padding[8] =
27 {
28   0x5e4ebf28,
29   0x418a754e,
30   0x564e0064,
31   0x0801faff,
32   0xb6002e2e,
33   0x803e68d0,
34   0xfea90c2f,
35   0x7a695364
36 };
37
38 typedef struct
39 {
40   u8 S[256];
41
42   u32 wtf_its_faster;
43
44 } RC4_KEY;
45
46 void swap (__local RC4_KEY *rc4_key, const u8 i, const u8 j)
47 {
48   u8 tmp;
49
50   tmp           = rc4_key->S[i];
51   rc4_key->S[i] = rc4_key->S[j];
52   rc4_key->S[j] = tmp;
53 }
54
55 void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
56 {
57   u32 v = 0x03020100;
58   u32 a = 0x04040404;
59
60   __local u32 *ptr = (__local u32 *) rc4_key->S;
61
62   #ifdef _unroll
63   #pragma unroll
64   #endif
65   for (u32 i = 0; i < 64; i++)
66   {
67     ptr[i] = v; v += a;
68   }
69
70   const u32 d0 = data[0] >>  0;
71   const u32 d1 = data[0] >>  8;
72   const u32 d2 = data[0] >> 16;
73   const u32 d3 = data[0] >> 24;
74   const u32 d4 = data[1] >>  0;
75
76   u32 j = 0;
77
78   #ifdef _unroll
79   #pragma unroll
80   #endif
81   for (u32 i = 0; i < 255; i += 5)
82   {
83     j += rc4_key->S[i + 0] + d0; swap (rc4_key, i + 0, j);
84     j += rc4_key->S[i + 1] + d1; swap (rc4_key, i + 1, j);
85     j += rc4_key->S[i + 2] + d2; swap (rc4_key, i + 2, j);
86     j += rc4_key->S[i + 3] + d3; swap (rc4_key, i + 3, j);
87     j += rc4_key->S[i + 4] + d4; swap (rc4_key, i + 4, j);
88   }
89
90   j += rc4_key->S[255] + d0; swap (rc4_key, 255, j);
91 }
92
93 u8 rc4_next_16 (__local RC4_KEY *rc4_key, u8 i, u8 j, __constant u32 *in, u32 out[4])
94 {
95   #ifdef _unroll
96   #pragma unroll
97   #endif
98   for (u32 k = 0; k < 4; k++)
99   {
100     u32 xor4 = 0;
101
102     u8 idx;
103
104     i += 1;
105     j += rc4_key->S[i];
106
107     swap (rc4_key, i, j);
108
109     idx = rc4_key->S[i] + rc4_key->S[j];
110
111     xor4 |= rc4_key->S[idx] <<  0;
112
113     i += 1;
114     j += rc4_key->S[i];
115
116     swap (rc4_key, i, j);
117
118     idx = rc4_key->S[i] + rc4_key->S[j];
119
120     xor4 |= rc4_key->S[idx] <<  8;
121
122     i += 1;
123     j += rc4_key->S[i];
124
125     swap (rc4_key, i, j);
126
127     idx = rc4_key->S[i] + rc4_key->S[j];
128
129     xor4 |= rc4_key->S[idx] << 16;
130
131     i += 1;
132     j += rc4_key->S[i];
133
134     swap (rc4_key, i, j);
135
136     idx = rc4_key->S[i] + rc4_key->S[j];
137
138     xor4 |= rc4_key->S[idx] << 24;
139
140     out[k] = in[k] ^ xor4;
141   }
142
143   return j;
144 }
145
146 __kernel void m10410_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
147 {
148   /**
149    * modifier
150    */
151
152   const u32 lid = get_local_id (0);
153
154   /**
155    * base
156    */
157
158   const u32 gid = get_global_id (0);
159
160   if (gid >= gid_max) return;
161
162   u32 pw_buf0[4];
163   u32 pw_buf1[4];
164
165   pw_buf0[0] = pws[gid].i[0];
166   pw_buf0[1] = pws[gid].i[1];
167   pw_buf0[2] = pws[gid].i[2];
168   pw_buf0[3] = pws[gid].i[3];
169   pw_buf1[0] = pws[gid].i[4];
170   pw_buf1[1] = pws[gid].i[5];
171   pw_buf1[2] = pws[gid].i[6];
172   pw_buf1[3] = pws[gid].i[7];
173
174   const u32 pw_l_len = pws[gid].pw_len;
175
176   /**
177    * shared
178    */
179
180   __local RC4_KEY rc4_keys[64];
181
182   __local RC4_KEY *rc4_key = &rc4_keys[lid];
183
184   /**
185    * U_buf
186    */
187
188   u32 o_buf[8];
189
190   o_buf[0] = pdf_bufs[salt_pos].o_buf[0];
191   o_buf[1] = pdf_bufs[salt_pos].o_buf[1];
192   o_buf[2] = pdf_bufs[salt_pos].o_buf[2];
193   o_buf[3] = pdf_bufs[salt_pos].o_buf[3];
194   o_buf[4] = pdf_bufs[salt_pos].o_buf[4];
195   o_buf[5] = pdf_bufs[salt_pos].o_buf[5];
196   o_buf[6] = pdf_bufs[salt_pos].o_buf[6];
197   o_buf[7] = pdf_bufs[salt_pos].o_buf[7];
198
199   u32 P = pdf_bufs[salt_pos].P;
200
201   u32 id_buf[4];
202
203   id_buf[0] = pdf_bufs[salt_pos].id_buf[0];
204   id_buf[1] = pdf_bufs[salt_pos].id_buf[1];
205   id_buf[2] = pdf_bufs[salt_pos].id_buf[2];
206   id_buf[3] = pdf_bufs[salt_pos].id_buf[3];
207
208   /**
209    * loop
210    */
211
212   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
213   {
214     const u32x pw_r_len = pwlenx_create_combt (combs_buf, il_pos);
215
216     const u32x pw_len = pw_l_len + pw_r_len;
217
218     /**
219      * concat password candidate
220      */
221
222     u32x wordl0[4] = { 0 };
223     u32x wordl1[4] = { 0 };
224     u32x wordl2[4] = { 0 };
225     u32x wordl3[4] = { 0 };
226
227     wordl0[0] = pw_buf0[0];
228     wordl0[1] = pw_buf0[1];
229     wordl0[2] = pw_buf0[2];
230     wordl0[3] = pw_buf0[3];
231     wordl1[0] = pw_buf1[0];
232     wordl1[1] = pw_buf1[1];
233     wordl1[2] = pw_buf1[2];
234     wordl1[3] = pw_buf1[3];
235
236     u32x wordr0[4] = { 0 };
237     u32x wordr1[4] = { 0 };
238     u32x wordr2[4] = { 0 };
239     u32x wordr3[4] = { 0 };
240
241     wordr0[0] = ix_create_combt (combs_buf, il_pos, 0);
242     wordr0[1] = ix_create_combt (combs_buf, il_pos, 1);
243     wordr0[2] = ix_create_combt (combs_buf, il_pos, 2);
244     wordr0[3] = ix_create_combt (combs_buf, il_pos, 3);
245     wordr1[0] = ix_create_combt (combs_buf, il_pos, 4);
246     wordr1[1] = ix_create_combt (combs_buf, il_pos, 5);
247     wordr1[2] = ix_create_combt (combs_buf, il_pos, 6);
248     wordr1[3] = ix_create_combt (combs_buf, il_pos, 7);
249
250     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
251     {
252       switch_buffer_by_offset_le_VV (wordr0, wordr1, wordr2, wordr3, pw_l_len);
253     }
254     else
255     {
256       switch_buffer_by_offset_le_VV (wordl0, wordl1, wordl2, wordl3, pw_r_len);
257     }
258
259     u32x w0[4];
260
261     w0[0] = wordl0[0] | wordr0[0];
262     w0[1] = wordl0[1] | wordr0[1];
263     w0[2] = 0;
264     w0[3] = 0;
265
266     /**
267      * pdf
268      */
269
270     rc4_init_16 (rc4_key, w0);
271
272     u32 out[4];
273
274     rc4_next_16 (rc4_key, 0, 0, padding, out);
275
276     COMPARE_M_SIMD (out[0], out[1], out[2], out[3]);
277   }
278 }
279
280 __kernel void m10410_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
281 {
282 }
283
284 __kernel void m10410_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
285 {
286 }
287
288 __kernel void m10410_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
289 {
290   /**
291    * modifier
292    */
293
294   const u32 lid = get_local_id (0);
295
296   /**
297    * base
298    */
299
300   const u32 gid = get_global_id (0);
301
302   if (gid >= gid_max) return;
303
304   u32 pw_buf0[4];
305   u32 pw_buf1[4];
306
307   pw_buf0[0] = pws[gid].i[0];
308   pw_buf0[1] = pws[gid].i[1];
309   pw_buf0[2] = pws[gid].i[2];
310   pw_buf0[3] = pws[gid].i[3];
311   pw_buf1[0] = pws[gid].i[4];
312   pw_buf1[1] = pws[gid].i[5];
313   pw_buf1[2] = pws[gid].i[6];
314   pw_buf1[3] = pws[gid].i[7];
315
316   const u32 pw_l_len = pws[gid].pw_len;
317
318   /**
319    * shared
320    */
321
322   __local RC4_KEY rc4_keys[64];
323
324   __local RC4_KEY *rc4_key = &rc4_keys[lid];
325
326   /**
327    * U_buf
328    */
329
330   u32 o_buf[8];
331
332   o_buf[0] = pdf_bufs[salt_pos].o_buf[0];
333   o_buf[1] = pdf_bufs[salt_pos].o_buf[1];
334   o_buf[2] = pdf_bufs[salt_pos].o_buf[2];
335   o_buf[3] = pdf_bufs[salt_pos].o_buf[3];
336   o_buf[4] = pdf_bufs[salt_pos].o_buf[4];
337   o_buf[5] = pdf_bufs[salt_pos].o_buf[5];
338   o_buf[6] = pdf_bufs[salt_pos].o_buf[6];
339   o_buf[7] = pdf_bufs[salt_pos].o_buf[7];
340
341   u32 P = pdf_bufs[salt_pos].P;
342
343   u32 id_buf[4];
344
345   id_buf[0] = pdf_bufs[salt_pos].id_buf[0];
346   id_buf[1] = pdf_bufs[salt_pos].id_buf[1];
347   id_buf[2] = pdf_bufs[salt_pos].id_buf[2];
348   id_buf[3] = pdf_bufs[salt_pos].id_buf[3];
349
350   /**
351    * digest
352    */
353
354   const u32 search[4] =
355   {
356     digests_buf[digests_offset].digest_buf[DGST_R0],
357     digests_buf[digests_offset].digest_buf[DGST_R1],
358     digests_buf[digests_offset].digest_buf[DGST_R2],
359     digests_buf[digests_offset].digest_buf[DGST_R3]
360   };
361
362   /**
363    * loop
364    */
365
366   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
367   {
368     const u32x pw_r_len = pwlenx_create_combt (combs_buf, il_pos);
369
370     const u32x pw_len = pw_l_len + pw_r_len;
371
372     /**
373      * concat password candidate
374      */
375
376     u32x wordl0[4] = { 0 };
377     u32x wordl1[4] = { 0 };
378     u32x wordl2[4] = { 0 };
379     u32x wordl3[4] = { 0 };
380
381     wordl0[0] = pw_buf0[0];
382     wordl0[1] = pw_buf0[1];
383     wordl0[2] = pw_buf0[2];
384     wordl0[3] = pw_buf0[3];
385     wordl1[0] = pw_buf1[0];
386     wordl1[1] = pw_buf1[1];
387     wordl1[2] = pw_buf1[2];
388     wordl1[3] = pw_buf1[3];
389
390     u32x wordr0[4] = { 0 };
391     u32x wordr1[4] = { 0 };
392     u32x wordr2[4] = { 0 };
393     u32x wordr3[4] = { 0 };
394
395     wordr0[0] = ix_create_combt (combs_buf, il_pos, 0);
396     wordr0[1] = ix_create_combt (combs_buf, il_pos, 1);
397     wordr0[2] = ix_create_combt (combs_buf, il_pos, 2);
398     wordr0[3] = ix_create_combt (combs_buf, il_pos, 3);
399     wordr1[0] = ix_create_combt (combs_buf, il_pos, 4);
400     wordr1[1] = ix_create_combt (combs_buf, il_pos, 5);
401     wordr1[2] = ix_create_combt (combs_buf, il_pos, 6);
402     wordr1[3] = ix_create_combt (combs_buf, il_pos, 7);
403
404     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
405     {
406       switch_buffer_by_offset_le_VV (wordr0, wordr1, wordr2, wordr3, pw_l_len);
407     }
408     else
409     {
410       switch_buffer_by_offset_le_VV (wordl0, wordl1, wordl2, wordl3, pw_r_len);
411     }
412
413     u32x w0[4];
414
415     w0[0] = wordl0[0] | wordr0[0];
416     w0[1] = wordl0[1] | wordr0[1];
417     w0[2] = 0;
418     w0[3] = 0;
419
420     /**
421      * pdf
422      */
423
424     rc4_init_16 (rc4_key, w0);
425
426     u32 out[4];
427
428     rc4_next_16 (rc4_key, 0, 0, padding, out);
429
430     COMPARE_S_SIMD (out[0], out[1], out[2], out[3]);
431   }
432 }
433
434 __kernel void m10410_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
435 {
436 }
437
438 __kernel void m10410_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global pdf_t *pdf_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
439 {
440 }