Replace the substring GPU to a more appropriate "device" or "kernel" substring depend...
[hashcat.git] / OpenCL / m07800_a0.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _SAPG_
7
8 #include "include/constants.h"
9 #include "include/kernel_vendor.h"
10
11 #define DGST_R0 3
12 #define DGST_R1 4
13 #define DGST_R2 2
14 #define DGST_R3 1
15
16 #include "include/kernel_functions.c"
17 #include "OpenCL/types_ocl.c"
18 #include "OpenCL/common.c"
19 #include "include/rp_kernel.h"
20 #include "OpenCL/rp.c"
21
22 #define COMPARE_S "OpenCL/check_single_comp4.c"
23 #define COMPARE_M "OpenCL/check_multi_comp4.c"
24
25 #define GETSHIFTEDINT(a,n) amd_bytealign ((a)[((n)/4)+1], (a)[((n)/4)+0], (n))
26
27 #define SETSHIFTEDINT(a,n,v)        \
28 {                                   \
29   const u32 s = ((n) & 3) * 8;     \
30   const u64 x = (u64) (v) << s; \
31   (a)[((n)/4)+0] |= x;              \
32   (a)[((n)/4)+1]  = x >> 32;        \
33 }
34
35 __constant u32 theMagicArray[64] =
36 {
37   0x1451ac91,0x4354679f,0xe03be724,0xc27b7428,0xeb133386,0x5ccb4f5a,0x37730a08,0x2f1c5d0e,
38   0xe5e68f33,0xddae9bf8,0x8d4bf216,0xdcd4e12c,0x9ddfcbb0,0x176d70d4,0x3f424df9,0x94111b9b,
39   0x9bc15b9f,0x039d0506,0x8a135e9d,0xe86a9a1e,0x17147cd9,0xf62ac758,0x0a6399a1,0xc370fdd7,
40   0x13745ef6,0x040bc903,0x26f79826,0x2593928a,0x230da2b0,0x6d7963ed,0x3cfa3213,0xa39a0235,
41   0x0a8eddb3,0xc351bf24,0x9f55cd7c,0x4c94af37,0x82520829,0x374e3bb2,0x9107179f,0xcdfd3b11,
42   0, 0, 0, 0, 0, 0, 0, 0,
43   0, 0, 0, 0, 0, 0, 0, 0,
44   0, 0, 0, 0, 0, 0, 0, 0
45 };
46
47 static void swap_buffer (u32 final[16])
48 {
49   final[ 0] = swap32 (final[ 0]);
50   final[ 1] = swap32 (final[ 1]);
51   final[ 2] = swap32 (final[ 2]);
52   final[ 3] = swap32 (final[ 3]);
53   final[ 4] = swap32 (final[ 4]);
54   final[ 5] = swap32 (final[ 5]);
55   final[ 6] = swap32 (final[ 6]);
56   final[ 7] = swap32 (final[ 7]);
57   final[ 8] = swap32 (final[ 8]);
58   final[ 9] = swap32 (final[ 9]);
59   final[10] = swap32 (final[10]);
60   final[11] = swap32 (final[11]);
61   final[12] = swap32 (final[12]);
62   final[13] = swap32 (final[13]);
63   final[14] = swap32 (final[14]);
64   final[15] = swap32 (final[15]);
65 }
66
67 static void sha1_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[5])
68 {
69   u32 A = digest[0];
70   u32 B = digest[1];
71   u32 C = digest[2];
72   u32 D = digest[3];
73   u32 E = digest[4];
74
75   u32 w0_t = w0[0];
76   u32 w1_t = w0[1];
77   u32 w2_t = w0[2];
78   u32 w3_t = w0[3];
79   u32 w4_t = w1[0];
80   u32 w5_t = w1[1];
81   u32 w6_t = w1[2];
82   u32 w7_t = w1[3];
83   u32 w8_t = w2[0];
84   u32 w9_t = w2[1];
85   u32 wa_t = w2[2];
86   u32 wb_t = w2[3];
87   u32 wc_t = w3[0];
88   u32 wd_t = w3[1];
89   u32 we_t = w3[2];
90   u32 wf_t = w3[3];
91
92   #undef K
93   #define K SHA1C00
94
95   SHA1_STEP (SHA1_F0o, A, B, C, D, E, w0_t);
96   SHA1_STEP (SHA1_F0o, E, A, B, C, D, w1_t);
97   SHA1_STEP (SHA1_F0o, D, E, A, B, C, w2_t);
98   SHA1_STEP (SHA1_F0o, C, D, E, A, B, w3_t);
99   SHA1_STEP (SHA1_F0o, B, C, D, E, A, w4_t);
100   SHA1_STEP (SHA1_F0o, A, B, C, D, E, w5_t);
101   SHA1_STEP (SHA1_F0o, E, A, B, C, D, w6_t);
102   SHA1_STEP (SHA1_F0o, D, E, A, B, C, w7_t);
103   SHA1_STEP (SHA1_F0o, C, D, E, A, B, w8_t);
104   SHA1_STEP (SHA1_F0o, B, C, D, E, A, w9_t);
105   SHA1_STEP (SHA1_F0o, A, B, C, D, E, wa_t);
106   SHA1_STEP (SHA1_F0o, E, A, B, C, D, wb_t);
107   SHA1_STEP (SHA1_F0o, D, E, A, B, C, wc_t);
108   SHA1_STEP (SHA1_F0o, C, D, E, A, B, wd_t);
109   SHA1_STEP (SHA1_F0o, B, C, D, E, A, we_t);
110   SHA1_STEP (SHA1_F0o, A, B, C, D, E, wf_t);
111   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F0o, E, A, B, C, D, w0_t);
112   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F0o, D, E, A, B, C, w1_t);
113   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F0o, C, D, E, A, B, w2_t);
114   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F0o, B, C, D, E, A, w3_t);
115
116   #undef K
117   #define K SHA1C01
118
119   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w4_t);
120   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w5_t);
121   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w6_t);
122   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w7_t);
123   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w8_t);
124   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w9_t);
125   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wa_t);
126   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, wb_t);
127   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, wc_t);
128   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wd_t);
129   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, we_t);
130   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wf_t);
131   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w0_t);
132   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w1_t);
133   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w2_t);
134   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w3_t);
135   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w4_t);
136   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w5_t);
137   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w6_t);
138   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w7_t);
139
140   #undef K
141   #define K SHA1C02
142
143   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w8_t);
144   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w9_t);
145   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, wa_t);
146   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, wb_t);
147   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, wc_t);
148   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, wd_t);
149   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, we_t);
150   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, wf_t);
151   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, w0_t);
152   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, w1_t);
153   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w2_t);
154   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w3_t);
155   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, w4_t);
156   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, w5_t);
157   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, w6_t);
158   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w7_t);
159   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w8_t);
160   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, w9_t);
161   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, wa_t);
162   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, wb_t);
163
164   #undef K
165   #define K SHA1C03
166
167   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, wc_t);
168   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wd_t);
169   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, we_t);
170   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, wf_t);
171   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w0_t);
172   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w1_t);
173   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w2_t);
174   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w3_t);
175   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w4_t);
176   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w5_t);
177   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w6_t);
178   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w7_t);
179   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w8_t);
180   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w9_t);
181   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wa_t);
182   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, wb_t);
183   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wc_t);
184   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, wd_t);
185   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, we_t);
186   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wf_t);
187
188   digest[0] += A;
189   digest[1] += B;
190   digest[2] += C;
191   digest[3] += D;
192   digest[4] += E;
193 }
194
195 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m07800_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
196 {
197   /**
198    * modifier
199    */
200
201   const u32 lid = get_local_id (0);
202
203   /**
204    * base
205    */
206
207   const u32 gid = get_global_id (0);
208
209   if (gid >= gid_max) return;
210
211   u32 pw_buf0[4];
212
213   pw_buf0[0] = pws[gid].i[ 0];
214   pw_buf0[1] = pws[gid].i[ 1];
215   pw_buf0[2] = pws[gid].i[ 2];
216   pw_buf0[3] = pws[gid].i[ 3];
217
218   u32 pw_buf1[4];
219
220   pw_buf1[0] = pws[gid].i[ 4];
221   pw_buf1[1] = pws[gid].i[ 5];
222   pw_buf1[2] = pws[gid].i[ 6];
223   pw_buf1[3] = pws[gid].i[ 7];
224
225   const u32 pw_len = pws[gid].pw_len;
226
227   /**
228    * salt
229    */
230
231   u32 salt_buf[8];
232
233   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
234   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
235   salt_buf[2] = salt_bufs[salt_pos].salt_buf[2];
236   salt_buf[3] = salt_bufs[salt_pos].salt_buf[3];
237   salt_buf[4] = salt_bufs[salt_pos].salt_buf[4];
238   salt_buf[5] = salt_bufs[salt_pos].salt_buf[5];
239   salt_buf[6] = salt_bufs[salt_pos].salt_buf[6];
240   salt_buf[7] = salt_bufs[salt_pos].salt_buf[7];
241
242   const u32 salt_len = salt_bufs[salt_pos].salt_len;
243
244   /**
245    * loop
246    */
247
248   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
249   {
250     u32 w0[4];
251
252     w0[0] = pw_buf0[0];
253     w0[1] = pw_buf0[1];
254     w0[2] = pw_buf0[2];
255     w0[3] = pw_buf0[3];
256
257     u32 w1[4];
258
259     w1[0] = pw_buf1[0];
260     w1[1] = pw_buf1[1];
261     w1[2] = pw_buf1[2];
262     w1[3] = pw_buf1[3];
263
264     u32 w2[4];
265
266     w2[0] = 0;
267     w2[1] = 0;
268     w2[2] = 0;
269     w2[3] = 0;
270
271     u32 w3[4];
272
273     w3[0] = 0;
274     w3[1] = 0;
275     w3[2] = 0;
276     w3[3] = 0;
277
278     const u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
279
280     /**
281      * append salt
282      */
283
284     u32 s0[4];
285
286     s0[0] = salt_buf[0];
287     s0[1] = salt_buf[1];
288     s0[2] = salt_buf[2];
289     s0[3] = salt_buf[3];
290
291     u32 s1[4];
292
293     s1[0] = salt_buf[4];
294     s1[1] = salt_buf[5];
295     s1[2] = salt_buf[6];
296     s1[3] = salt_buf[7];
297
298     u32 s2[4];
299
300     s2[0] = 0;
301     s2[1] = 0;
302     s2[2] = 0;
303     s2[3] = 0;
304
305     u32 s3[4];
306
307     s3[0] = 0;
308     s3[1] = 0;
309     s3[2] = 0;
310     s3[3] = 0;
311
312     switch_buffer_by_offset (s0, s1, s2, s3, out_len);
313
314     const u32 pw_salt_len = out_len + salt_len;
315
316     /**
317      * sha1
318      */
319
320     u32 final[32];
321
322     final[ 0] = swap32 (w0[0] | s0[0]);
323     final[ 1] = swap32 (w0[1] | s0[1]);
324     final[ 2] = swap32 (w0[2] | s0[2]);
325     final[ 3] = swap32 (w0[3] | s0[3]);
326     final[ 4] = swap32 (w1[0] | s1[0]);
327     final[ 5] = swap32 (w1[1] | s1[1]);
328     final[ 6] = swap32 (w1[2] | s1[2]);
329     final[ 7] = swap32 (w1[3] | s1[3]);
330     final[ 8] = swap32 (w2[0] | s2[0]);
331     final[ 9] = swap32 (w2[1] | s2[1]);
332     final[10] = swap32 (w2[2] | s2[2]);
333     final[11] = swap32 (w2[3] | s2[3]);
334     final[12] = swap32 (w3[0] | s3[0]);
335     final[13] = swap32 (w3[1] | s3[1]);
336     final[14] = 0;
337     final[15] = pw_salt_len * 8;
338
339     u32 digest[5];
340
341     digest[0] = SHA1M_A;
342     digest[1] = SHA1M_B;
343     digest[2] = SHA1M_C;
344     digest[3] = SHA1M_D;
345     digest[4] = SHA1M_E;
346
347     sha1_transform (&final[0], &final[4], &final[8], &final[12], digest);
348
349     // prepare magic array range
350
351     u32 lengthMagicArray = 0x20;
352     u32 offsetMagicArray = 0;
353
354     lengthMagicArray += ((digest[0] >> 24) & 0xff) % 6;
355     lengthMagicArray += ((digest[0] >> 16) & 0xff) % 6;
356     lengthMagicArray += ((digest[0] >>  8) & 0xff) % 6;
357     lengthMagicArray += ((digest[0] >>  0) & 0xff) % 6;
358     lengthMagicArray += ((digest[1] >> 24) & 0xff) % 6;
359     lengthMagicArray += ((digest[1] >> 16) & 0xff) % 6;
360     lengthMagicArray += ((digest[1] >>  8) & 0xff) % 6;
361     lengthMagicArray += ((digest[1] >>  0) & 0xff) % 6;
362     lengthMagicArray += ((digest[2] >> 24) & 0xff) % 6;
363     lengthMagicArray += ((digest[2] >> 16) & 0xff) % 6;
364     offsetMagicArray += ((digest[2] >>  8) & 0xff) % 8;
365     offsetMagicArray += ((digest[2] >>  0) & 0xff) % 8;
366     offsetMagicArray += ((digest[3] >> 24) & 0xff) % 8;
367     offsetMagicArray += ((digest[3] >> 16) & 0xff) % 8;
368     offsetMagicArray += ((digest[3] >>  8) & 0xff) % 8;
369     offsetMagicArray += ((digest[3] >>  0) & 0xff) % 8;
370     offsetMagicArray += ((digest[4] >> 24) & 0xff) % 8;
371     offsetMagicArray += ((digest[4] >> 16) & 0xff) % 8;
372     offsetMagicArray += ((digest[4] >>  8) & 0xff) % 8;
373     offsetMagicArray += ((digest[4] >>  0) & 0xff) % 8;
374
375     // final
376
377     digest[0] = SHA1M_A;
378     digest[1] = SHA1M_B;
379     digest[2] = SHA1M_C;
380     digest[3] = SHA1M_D;
381     digest[4] = SHA1M_E;
382
383     #pragma unroll 32
384     for (int i = 0; i < 32; i++) final[i] = 0;
385
386     final[0] = w0[0];
387     final[1] = w0[1];
388     final[2] = w0[2];
389     final[3] = w0[3];
390     final[4] = w1[0];
391     final[5] = w1[1];
392     final[6] = w1[2];
393     final[7] = w1[3];
394
395     u32 final_len = out_len;
396
397     int i;
398
399     // append MagicArray
400
401     for (i = 0; i < lengthMagicArray - 4; i += 4)
402     {
403       const u32 tmp = GETSHIFTEDINT (theMagicArray, offsetMagicArray + i);
404
405       SETSHIFTEDINT (final, final_len + i, tmp);
406     }
407
408     const u32 mask = 0xffffffff >> (((i - lengthMagicArray) & 3) * 8);
409
410     const u32 tmp = GETSHIFTEDINT (theMagicArray, offsetMagicArray + i) & mask;
411
412     SETSHIFTEDINT (final, final_len + i, tmp);
413
414     final_len += lengthMagicArray;
415
416     // append Salt
417
418     for (i = 0; i < salt_len + 1; i += 4) // +1 for the 0x80
419     {
420       const u32 tmp = salt_buf[i / 4]; // attention, int[] not char[]
421
422       SETSHIFTEDINT (final, final_len + i, tmp);
423     }
424
425     final_len += salt_len;
426
427     // calculate
428
429     int left;
430     int off;
431
432     for (left = final_len, off = 0; left >= 56; left -= 64, off += 16)
433     {
434       swap_buffer (&final[off]);
435
436       sha1_transform (&final[off + 0], &final[off + 4], &final[off + 8], &final[off + 12], digest);
437     }
438
439     swap_buffer (&final[off]);
440
441     final[off + 14] = 0;
442     final[off + 15] = final_len * 8;
443
444     sha1_transform (&final[off + 0], &final[off + 4], &final[off + 8], &final[off + 12], digest);
445
446     const u32 r0 = digest[3];
447     const u32 r1 = digest[4];
448     const u32 r2 = digest[2];
449     const u32 r3 = digest[1];
450
451     #include COMPARE_M
452   }
453 }
454
455 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m07800_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
456 {
457 }
458
459 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m07800_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
460 {
461 }
462
463 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m07800_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
464 {
465   /**
466    * modifier
467    */
468
469   const u32 lid = get_local_id (0);
470
471   /**
472    * base
473    */
474
475   const u32 gid = get_global_id (0);
476
477   if (gid >= gid_max) return;
478
479   u32 pw_buf0[4];
480
481   pw_buf0[0] = pws[gid].i[ 0];
482   pw_buf0[1] = pws[gid].i[ 1];
483   pw_buf0[2] = pws[gid].i[ 2];
484   pw_buf0[3] = pws[gid].i[ 3];
485
486   u32 pw_buf1[4];
487
488   pw_buf1[0] = pws[gid].i[ 4];
489   pw_buf1[1] = pws[gid].i[ 5];
490   pw_buf1[2] = pws[gid].i[ 6];
491   pw_buf1[3] = pws[gid].i[ 7];
492
493   const u32 pw_len = pws[gid].pw_len;
494
495   /**
496    * salt
497    */
498
499   u32 salt_buf[8];
500
501   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
502   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
503   salt_buf[2] = salt_bufs[salt_pos].salt_buf[2];
504   salt_buf[3] = salt_bufs[salt_pos].salt_buf[3];
505   salt_buf[4] = salt_bufs[salt_pos].salt_buf[4];
506   salt_buf[5] = salt_bufs[salt_pos].salt_buf[5];
507   salt_buf[6] = salt_bufs[salt_pos].salt_buf[6];
508   salt_buf[7] = salt_bufs[salt_pos].salt_buf[7];
509
510   const u32 salt_len = salt_bufs[salt_pos].salt_len;
511
512   /**
513    * digest
514    */
515
516   const u32 search[4] =
517   {
518     digests_buf[digests_offset].digest_buf[DGST_R0],
519     digests_buf[digests_offset].digest_buf[DGST_R1],
520     digests_buf[digests_offset].digest_buf[DGST_R2],
521     digests_buf[digests_offset].digest_buf[DGST_R3]
522   };
523
524   /**
525    * loop
526    */
527
528   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
529   {
530     u32 w0[4];
531
532     w0[0] = pw_buf0[0];
533     w0[1] = pw_buf0[1];
534     w0[2] = pw_buf0[2];
535     w0[3] = pw_buf0[3];
536
537     u32 w1[4];
538
539     w1[0] = pw_buf1[0];
540     w1[1] = pw_buf1[1];
541     w1[2] = pw_buf1[2];
542     w1[3] = pw_buf1[3];
543
544     u32 w2[4];
545
546     w2[0] = 0;
547     w2[1] = 0;
548     w2[2] = 0;
549     w2[3] = 0;
550
551     u32 w3[4];
552
553     w3[0] = 0;
554     w3[1] = 0;
555     w3[2] = 0;
556     w3[3] = 0;
557
558     const u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
559
560     /**
561      * append salt
562      */
563
564     u32 s0[4];
565
566     s0[0] = salt_buf[0];
567     s0[1] = salt_buf[1];
568     s0[2] = salt_buf[2];
569     s0[3] = salt_buf[3];
570
571     u32 s1[4];
572
573     s1[0] = salt_buf[4];
574     s1[1] = salt_buf[5];
575     s1[2] = salt_buf[6];
576     s1[3] = salt_buf[7];
577
578     u32 s2[4];
579
580     s2[0] = 0;
581     s2[1] = 0;
582     s2[2] = 0;
583     s2[3] = 0;
584
585     u32 s3[4];
586
587     s3[0] = 0;
588     s3[1] = 0;
589     s3[2] = 0;
590     s3[3] = 0;
591
592     switch_buffer_by_offset (s0, s1, s2, s3, out_len);
593
594     const u32 pw_salt_len = out_len + salt_len;
595
596     /**
597      * sha1
598      */
599
600     u32 final[32];
601
602     final[ 0] = swap32 (w0[0] | s0[0]);
603     final[ 1] = swap32 (w0[1] | s0[1]);
604     final[ 2] = swap32 (w0[2] | s0[2]);
605     final[ 3] = swap32 (w0[3] | s0[3]);
606     final[ 4] = swap32 (w1[0] | s1[0]);
607     final[ 5] = swap32 (w1[1] | s1[1]);
608     final[ 6] = swap32 (w1[2] | s1[2]);
609     final[ 7] = swap32 (w1[3] | s1[3]);
610     final[ 8] = swap32 (w2[0] | s2[0]);
611     final[ 9] = swap32 (w2[1] | s2[1]);
612     final[10] = swap32 (w2[2] | s2[2]);
613     final[11] = swap32 (w2[3] | s2[3]);
614     final[12] = swap32 (w3[0] | s3[0]);
615     final[13] = swap32 (w3[1] | s3[1]);
616     final[14] = 0;
617     final[15] = pw_salt_len * 8;
618
619     u32 digest[5];
620
621     digest[0] = SHA1M_A;
622     digest[1] = SHA1M_B;
623     digest[2] = SHA1M_C;
624     digest[3] = SHA1M_D;
625     digest[4] = SHA1M_E;
626
627     sha1_transform (&final[0], &final[4], &final[8], &final[12], digest);
628
629     // prepare magic array range
630
631     u32 lengthMagicArray = 0x20;
632     u32 offsetMagicArray = 0;
633
634     lengthMagicArray += ((digest[0] >> 24) & 0xff) % 6;
635     lengthMagicArray += ((digest[0] >> 16) & 0xff) % 6;
636     lengthMagicArray += ((digest[0] >>  8) & 0xff) % 6;
637     lengthMagicArray += ((digest[0] >>  0) & 0xff) % 6;
638     lengthMagicArray += ((digest[1] >> 24) & 0xff) % 6;
639     lengthMagicArray += ((digest[1] >> 16) & 0xff) % 6;
640     lengthMagicArray += ((digest[1] >>  8) & 0xff) % 6;
641     lengthMagicArray += ((digest[1] >>  0) & 0xff) % 6;
642     lengthMagicArray += ((digest[2] >> 24) & 0xff) % 6;
643     lengthMagicArray += ((digest[2] >> 16) & 0xff) % 6;
644     offsetMagicArray += ((digest[2] >>  8) & 0xff) % 8;
645     offsetMagicArray += ((digest[2] >>  0) & 0xff) % 8;
646     offsetMagicArray += ((digest[3] >> 24) & 0xff) % 8;
647     offsetMagicArray += ((digest[3] >> 16) & 0xff) % 8;
648     offsetMagicArray += ((digest[3] >>  8) & 0xff) % 8;
649     offsetMagicArray += ((digest[3] >>  0) & 0xff) % 8;
650     offsetMagicArray += ((digest[4] >> 24) & 0xff) % 8;
651     offsetMagicArray += ((digest[4] >> 16) & 0xff) % 8;
652     offsetMagicArray += ((digest[4] >>  8) & 0xff) % 8;
653     offsetMagicArray += ((digest[4] >>  0) & 0xff) % 8;
654
655     // final
656
657     digest[0] = SHA1M_A;
658     digest[1] = SHA1M_B;
659     digest[2] = SHA1M_C;
660     digest[3] = SHA1M_D;
661     digest[4] = SHA1M_E;
662
663     #pragma unroll 32
664     for (int i = 0; i < 32; i++) final[i] = 0;
665
666     final[0] = w0[0];
667     final[1] = w0[1];
668     final[2] = w0[2];
669     final[3] = w0[3];
670     final[4] = w1[0];
671     final[5] = w1[1];
672     final[6] = w1[2];
673     final[7] = w1[3];
674
675     u32 final_len = out_len;
676
677     int i;
678
679     // append MagicArray
680
681     for (i = 0; i < lengthMagicArray - 4; i += 4)
682     {
683       const u32 tmp = GETSHIFTEDINT (theMagicArray, offsetMagicArray + i);
684
685       SETSHIFTEDINT (final, final_len + i, tmp);
686     }
687
688     const u32 mask = 0xffffffff >> (((i - lengthMagicArray) & 3) * 8);
689
690     const u32 tmp = GETSHIFTEDINT (theMagicArray, offsetMagicArray + i) & mask;
691
692     SETSHIFTEDINT (final, final_len + i, tmp);
693
694     final_len += lengthMagicArray;
695
696     // append Salt
697
698     for (i = 0; i < salt_len + 1; i += 4) // +1 for the 0x80
699     {
700       const u32 tmp = salt_buf[i / 4]; // attention, int[] not char[]
701
702       SETSHIFTEDINT (final, final_len + i, tmp);
703     }
704
705     final_len += salt_len;
706
707     // calculate
708
709     int left;
710     int off;
711
712     for (left = final_len, off = 0; left >= 56; left -= 64, off += 16)
713     {
714       swap_buffer (&final[off]);
715
716       sha1_transform (&final[off + 0], &final[off + 4], &final[off + 8], &final[off + 12], digest);
717     }
718
719     swap_buffer (&final[off]);
720
721     final[off + 14] = 0;
722     final[off + 15] = final_len * 8;
723
724     sha1_transform (&final[off + 0], &final[off + 4], &final[off + 8], &final[off + 12], digest);
725
726     const u32 r0 = digest[3];
727     const u32 r1 = digest[4];
728     const u32 r2 = digest[2];
729     const u32 r3 = digest[1];
730
731     #include COMPARE_S
732   }
733 }
734
735 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m07800_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
736 {
737 }
738
739 __kernel void __attribute__((reqd_work_group_size (64, 1, 1))) m07800_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
740 {
741 }