Fix m 60 a 0 by making modified variable non-const
[hashcat.git] / OpenCL / m04900_a1.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _SHA1_
7
8 #define NEW_SIMD_CODE
9
10 #include "inc_vendor.cl"
11 #include "inc_hash_constants.h"
12 #include "inc_hash_functions.cl"
13 #include "inc_types.cl"
14 #include "inc_common.cl"
15 #include "inc_simd.cl"
16
17 __kernel void m04900_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
18 {
19   /**
20    * modifier
21    */
22
23   const u32 lid = get_local_id (0);
24
25   /**
26    * base
27    */
28
29   const u32 gid = get_global_id (0);
30
31   if (gid >= gid_max) return;
32
33   u32 pw_buf0[4];
34   u32 pw_buf1[4];
35
36   pw_buf0[0] = pws[gid].i[0];
37   pw_buf0[1] = pws[gid].i[1];
38   pw_buf0[2] = pws[gid].i[2];
39   pw_buf0[3] = pws[gid].i[3];
40   pw_buf1[0] = pws[gid].i[4];
41   pw_buf1[1] = pws[gid].i[5];
42   pw_buf1[2] = pws[gid].i[6];
43   pw_buf1[3] = pws[gid].i[7];
44
45   const u32 pw_l_len = pws[gid].pw_len;
46
47   /**
48    * salt
49    */
50
51   u32 salt_buf0[4];
52   u32 salt_buf1[4];
53   u32 salt_buf2[4];
54   u32 salt_buf3[4];
55
56   salt_buf0[0] = salt_bufs[salt_pos].salt_buf[ 0];
57   salt_buf0[1] = salt_bufs[salt_pos].salt_buf[ 1];
58   salt_buf0[2] = salt_bufs[salt_pos].salt_buf[ 2];
59   salt_buf0[3] = salt_bufs[salt_pos].salt_buf[ 3];
60   salt_buf1[0] = salt_bufs[salt_pos].salt_buf[ 4];
61   salt_buf1[1] = salt_bufs[salt_pos].salt_buf[ 5];
62   salt_buf1[2] = salt_bufs[salt_pos].salt_buf[ 6];
63   salt_buf1[3] = salt_bufs[salt_pos].salt_buf[ 7];
64   salt_buf2[0] = salt_bufs[salt_pos].salt_buf[ 8];
65   salt_buf2[1] = salt_bufs[salt_pos].salt_buf[ 9];
66   salt_buf2[2] = salt_bufs[salt_pos].salt_buf[10];
67   salt_buf2[3] = salt_bufs[salt_pos].salt_buf[11];
68   salt_buf3[0] = salt_bufs[salt_pos].salt_buf[12];
69   salt_buf3[1] = salt_bufs[salt_pos].salt_buf[13];
70   salt_buf3[2] = salt_bufs[salt_pos].salt_buf[14];
71   salt_buf3[3] = salt_bufs[salt_pos].salt_buf[15];
72
73   const u32 salt_len = salt_bufs[salt_pos].salt_len;
74
75   /**
76    * loop
77    */
78
79   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
80   {
81     const u32x pw_r_len = pwlenx_create_combt (combs_buf, il_pos);
82
83     const u32x pw_len = pw_l_len + pw_r_len;
84
85     /**
86      * concat password candidate
87      */
88
89     u32x wordl0[4] = { 0 };
90     u32x wordl1[4] = { 0 };
91     u32x wordl2[4] = { 0 };
92     u32x wordl3[4] = { 0 };
93
94     wordl0[0] = pw_buf0[0];
95     wordl0[1] = pw_buf0[1];
96     wordl0[2] = pw_buf0[2];
97     wordl0[3] = pw_buf0[3];
98     wordl1[0] = pw_buf1[0];
99     wordl1[1] = pw_buf1[1];
100     wordl1[2] = pw_buf1[2];
101     wordl1[3] = pw_buf1[3];
102
103     u32x wordr0[4] = { 0 };
104     u32x wordr1[4] = { 0 };
105     u32x wordr2[4] = { 0 };
106     u32x wordr3[4] = { 0 };
107
108     wordr0[0] = ix_create_combt (combs_buf, il_pos, 0);
109     wordr0[1] = ix_create_combt (combs_buf, il_pos, 1);
110     wordr0[2] = ix_create_combt (combs_buf, il_pos, 2);
111     wordr0[3] = ix_create_combt (combs_buf, il_pos, 3);
112     wordr1[0] = ix_create_combt (combs_buf, il_pos, 4);
113     wordr1[1] = ix_create_combt (combs_buf, il_pos, 5);
114     wordr1[2] = ix_create_combt (combs_buf, il_pos, 6);
115     wordr1[3] = ix_create_combt (combs_buf, il_pos, 7);
116
117     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
118     {
119       switch_buffer_by_offset_le_VV (wordr0, wordr1, wordr2, wordr3, pw_l_len);
120     }
121     else
122     {
123       switch_buffer_by_offset_le_VV (wordl0, wordl1, wordl2, wordl3, pw_r_len);
124     }
125
126     u32x w0[4];
127     u32x w1[4];
128     u32x w2[4];
129     u32x w3[4];
130
131     w0[0] = wordl0[0] | wordr0[0];
132     w0[1] = wordl0[1] | wordr0[1];
133     w0[2] = wordl0[2] | wordr0[2];
134     w0[3] = wordl0[3] | wordr0[3];
135     w1[0] = wordl1[0] | wordr1[0];
136     w1[1] = wordl1[1] | wordr1[1];
137     w1[2] = wordl1[2] | wordr1[2];
138     w1[3] = wordl1[3] | wordr1[3];
139     w2[0] = wordl2[0] | wordr2[0];
140     w2[1] = wordl2[1] | wordr2[1];
141     w2[2] = wordl2[2] | wordr2[2];
142     w2[3] = wordl2[3] | wordr2[3];
143     w3[0] = wordl3[0] | wordr3[0];
144     w3[1] = wordl3[1] | wordr3[1];
145     w3[2] = wordl3[2] | wordr3[2];
146     w3[3] = wordl3[3] | wordr3[3];
147
148     /**
149      * prepend salt
150      */
151
152     switch_buffer_by_offset_le (w0, w1, w2, w3, salt_len);
153
154     const u32x pw_salt_len = pw_len + salt_len;
155
156     w0[0] |= salt_buf0[0];
157     w0[1] |= salt_buf0[1];
158     w0[2] |= salt_buf0[2];
159     w0[3] |= salt_buf0[3];
160     w1[0] |= salt_buf1[0];
161     w1[1] |= salt_buf1[1];
162     w1[2] |= salt_buf1[2];
163     w1[3] |= salt_buf1[3];
164     w2[0] |= salt_buf2[0];
165     w2[1] |= salt_buf2[1];
166     w2[2] |= salt_buf2[2];
167     w2[3] |= salt_buf2[3];
168     w3[0] |= salt_buf3[0];
169     w3[1] |= salt_buf3[1];
170     w3[2] |= salt_buf3[2];
171     w3[3] |= salt_buf3[3];
172
173     /**
174      * append salt
175      */
176
177     u32x s0[4];
178     u32x s1[4];
179     u32x s2[4];
180     u32x s3[4];
181
182     s0[0] = salt_buf0[0];
183     s0[1] = salt_buf0[1];
184     s0[2] = salt_buf0[2];
185     s0[3] = salt_buf0[3];
186     s1[0] = salt_buf1[0];
187     s1[1] = salt_buf1[1];
188     s1[2] = salt_buf1[2];
189     s1[3] = salt_buf1[3];
190     s2[0] = salt_buf2[0];
191     s2[1] = salt_buf2[1];
192     s2[2] = salt_buf2[2];
193     s2[3] = salt_buf2[3];
194     s3[0] = salt_buf3[0];
195     s3[1] = salt_buf3[1];
196     s3[2] = salt_buf3[2];
197     s3[3] = salt_buf3[3];
198
199     switch_buffer_by_offset_le_VV (s0, s1, s2, s3, pw_salt_len);
200
201     w0[0] |= s0[0];
202     w0[1] |= s0[1];
203     w0[2] |= s0[2];
204     w0[3] |= s0[3];
205     w1[0] |= s1[0];
206     w1[1] |= s1[1];
207     w1[2] |= s1[2];
208     w1[3] |= s1[3];
209     w2[0] |= s2[0];
210     w2[1] |= s2[1];
211     w2[2] |= s2[2];
212     w2[3] |= s2[3];
213     w3[0] |= s3[0];
214     w3[1] |= s3[1];
215     w3[2] |= s3[2];
216     w3[3] |= s3[3];
217
218     const u32x salt_pw_salt_len = salt_len + pw_len + salt_len;
219
220     append_0x80_4x4_VV (w0, w1, w2, w3, salt_pw_salt_len);
221
222     /**
223      * sha1
224      */
225
226     u32x w0_t = swap32 (w0[0]);
227     u32x w1_t = swap32 (w0[1]);
228     u32x w2_t = swap32 (w0[2]);
229     u32x w3_t = swap32 (w0[3]);
230     u32x w4_t = swap32 (w1[0]);
231     u32x w5_t = swap32 (w1[1]);
232     u32x w6_t = swap32 (w1[2]);
233     u32x w7_t = swap32 (w1[3]);
234     u32x w8_t = swap32 (w2[0]);
235     u32x w9_t = swap32 (w2[1]);
236     u32x wa_t = swap32 (w2[2]);
237     u32x wb_t = swap32 (w2[3]);
238     u32x wc_t = swap32 (w3[0]);
239     u32x wd_t = swap32 (w3[1]);
240     u32x we_t = 0;
241     u32x wf_t = salt_pw_salt_len * 8;
242
243     u32x a = SHA1M_A;
244     u32x b = SHA1M_B;
245     u32x c = SHA1M_C;
246     u32x d = SHA1M_D;
247     u32x e = SHA1M_E;
248
249     #undef K
250     #define K SHA1C00
251
252     SHA1_STEP (SHA1_F0o, a, b, c, d, e, w0_t);
253     SHA1_STEP (SHA1_F0o, e, a, b, c, d, w1_t);
254     SHA1_STEP (SHA1_F0o, d, e, a, b, c, w2_t);
255     SHA1_STEP (SHA1_F0o, c, d, e, a, b, w3_t);
256     SHA1_STEP (SHA1_F0o, b, c, d, e, a, w4_t);
257     SHA1_STEP (SHA1_F0o, a, b, c, d, e, w5_t);
258     SHA1_STEP (SHA1_F0o, e, a, b, c, d, w6_t);
259     SHA1_STEP (SHA1_F0o, d, e, a, b, c, w7_t);
260     SHA1_STEP (SHA1_F0o, c, d, e, a, b, w8_t);
261     SHA1_STEP (SHA1_F0o, b, c, d, e, a, w9_t);
262     SHA1_STEP (SHA1_F0o, a, b, c, d, e, wa_t);
263     SHA1_STEP (SHA1_F0o, e, a, b, c, d, wb_t);
264     SHA1_STEP (SHA1_F0o, d, e, a, b, c, wc_t);
265     SHA1_STEP (SHA1_F0o, c, d, e, a, b, wd_t);
266     SHA1_STEP (SHA1_F0o, b, c, d, e, a, we_t);
267     SHA1_STEP (SHA1_F0o, a, b, c, d, e, wf_t);
268     w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F0o, e, a, b, c, d, w0_t);
269     w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F0o, d, e, a, b, c, w1_t);
270     w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F0o, c, d, e, a, b, w2_t);
271     w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F0o, b, c, d, e, a, w3_t);
272
273     #undef K
274     #define K SHA1C01
275
276     w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w4_t);
277     w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, w5_t);
278     w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w6_t);
279     w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w7_t);
280     w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w8_t);
281     w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w9_t);
282     wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, wa_t);
283     wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, wb_t);
284     wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, wc_t);
285     wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, wd_t);
286     we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, we_t);
287     wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, wf_t);
288     w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w0_t);
289     w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w1_t);
290     w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w2_t);
291     w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w3_t);
292     w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, w4_t);
293     w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w5_t);
294     w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w6_t);
295     w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w7_t);
296
297     #undef K
298     #define K SHA1C02
299
300     w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, a, b, c, d, e, w8_t);
301     w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, e, a, b, c, d, w9_t);
302     wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, d, e, a, b, c, wa_t);
303     wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, c, d, e, a, b, wb_t);
304     wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F2o, b, c, d, e, a, wc_t);
305     wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F2o, a, b, c, d, e, wd_t);
306     we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F2o, e, a, b, c, d, we_t);
307     wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F2o, d, e, a, b, c, wf_t);
308     w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F2o, c, d, e, a, b, w0_t);
309     w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F2o, b, c, d, e, a, w1_t);
310     w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F2o, a, b, c, d, e, w2_t);
311     w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F2o, e, a, b, c, d, w3_t);
312     w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F2o, d, e, a, b, c, w4_t);
313     w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F2o, c, d, e, a, b, w5_t);
314     w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F2o, b, c, d, e, a, w6_t);
315     w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F2o, a, b, c, d, e, w7_t);
316     w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, e, a, b, c, d, w8_t);
317     w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, d, e, a, b, c, w9_t);
318     wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, c, d, e, a, b, wa_t);
319     wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, b, c, d, e, a, wb_t);
320
321     #undef K
322     #define K SHA1C03
323
324     wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, wc_t);
325     wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, wd_t);
326     we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, we_t);
327     wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, wf_t);
328     w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w0_t);
329     w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w1_t);
330     w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, w2_t);
331     w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w3_t);
332     w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w4_t);
333     w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w5_t);
334     w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w6_t);
335     w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, w7_t);
336     w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w8_t);
337     w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w9_t);
338     wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, wa_t);
339     wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, wb_t);
340     wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, wc_t);
341     wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, wd_t);
342     we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, we_t);
343     wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, wf_t);
344
345     COMPARE_M_SIMD (d, e, c, b);
346   }
347 }
348
349 __kernel void m04900_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
350 {
351 }
352
353 __kernel void m04900_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
354 {
355 }
356
357 __kernel void m04900_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
358 {
359   /**
360    * modifier
361    */
362
363   const u32 lid = get_local_id (0);
364
365   /**
366    * base
367    */
368
369   const u32 gid = get_global_id (0);
370
371   if (gid >= gid_max) return;
372
373   u32 pw_buf0[4];
374   u32 pw_buf1[4];
375
376   pw_buf0[0] = pws[gid].i[0];
377   pw_buf0[1] = pws[gid].i[1];
378   pw_buf0[2] = pws[gid].i[2];
379   pw_buf0[3] = pws[gid].i[3];
380   pw_buf1[0] = pws[gid].i[4];
381   pw_buf1[1] = pws[gid].i[5];
382   pw_buf1[2] = pws[gid].i[6];
383   pw_buf1[3] = pws[gid].i[7];
384
385   const u32 pw_l_len = pws[gid].pw_len;
386
387   /**
388    * salt
389    */
390
391   u32 salt_buf0[4];
392   u32 salt_buf1[4];
393   u32 salt_buf2[4];
394   u32 salt_buf3[4];
395
396   salt_buf0[0] = salt_bufs[salt_pos].salt_buf[ 0];
397   salt_buf0[1] = salt_bufs[salt_pos].salt_buf[ 1];
398   salt_buf0[2] = salt_bufs[salt_pos].salt_buf[ 2];
399   salt_buf0[3] = salt_bufs[salt_pos].salt_buf[ 3];
400   salt_buf1[0] = salt_bufs[salt_pos].salt_buf[ 4];
401   salt_buf1[1] = salt_bufs[salt_pos].salt_buf[ 5];
402   salt_buf1[2] = salt_bufs[salt_pos].salt_buf[ 6];
403   salt_buf1[3] = salt_bufs[salt_pos].salt_buf[ 7];
404   salt_buf2[0] = salt_bufs[salt_pos].salt_buf[ 8];
405   salt_buf2[1] = salt_bufs[salt_pos].salt_buf[ 9];
406   salt_buf2[2] = salt_bufs[salt_pos].salt_buf[10];
407   salt_buf2[3] = salt_bufs[salt_pos].salt_buf[11];
408   salt_buf3[0] = salt_bufs[salt_pos].salt_buf[12];
409   salt_buf3[1] = salt_bufs[salt_pos].salt_buf[13];
410   salt_buf3[2] = salt_bufs[salt_pos].salt_buf[14];
411   salt_buf3[3] = salt_bufs[salt_pos].salt_buf[15];
412
413   const u32 salt_len = salt_bufs[salt_pos].salt_len;
414
415   /**
416    * digest
417    */
418
419   const u32 search[4] =
420   {
421     digests_buf[digests_offset].digest_buf[DGST_R0],
422     digests_buf[digests_offset].digest_buf[DGST_R1],
423     digests_buf[digests_offset].digest_buf[DGST_R2],
424     digests_buf[digests_offset].digest_buf[DGST_R3]
425   };
426
427   /**
428    * reverse
429    */
430
431   const u32 e_rev = rotl32_S (search[1], 2u);
432
433   /**
434    * loop
435    */
436
437   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
438   {
439     const u32x pw_r_len = pwlenx_create_combt (combs_buf, il_pos);
440
441     const u32x pw_len = pw_l_len + pw_r_len;
442
443     /**
444      * concat password candidate
445      */
446
447     u32x wordl0[4] = { 0 };
448     u32x wordl1[4] = { 0 };
449     u32x wordl2[4] = { 0 };
450     u32x wordl3[4] = { 0 };
451
452     wordl0[0] = pw_buf0[0];
453     wordl0[1] = pw_buf0[1];
454     wordl0[2] = pw_buf0[2];
455     wordl0[3] = pw_buf0[3];
456     wordl1[0] = pw_buf1[0];
457     wordl1[1] = pw_buf1[1];
458     wordl1[2] = pw_buf1[2];
459     wordl1[3] = pw_buf1[3];
460
461     u32x wordr0[4] = { 0 };
462     u32x wordr1[4] = { 0 };
463     u32x wordr2[4] = { 0 };
464     u32x wordr3[4] = { 0 };
465
466     wordr0[0] = ix_create_combt (combs_buf, il_pos, 0);
467     wordr0[1] = ix_create_combt (combs_buf, il_pos, 1);
468     wordr0[2] = ix_create_combt (combs_buf, il_pos, 2);
469     wordr0[3] = ix_create_combt (combs_buf, il_pos, 3);
470     wordr1[0] = ix_create_combt (combs_buf, il_pos, 4);
471     wordr1[1] = ix_create_combt (combs_buf, il_pos, 5);
472     wordr1[2] = ix_create_combt (combs_buf, il_pos, 6);
473     wordr1[3] = ix_create_combt (combs_buf, il_pos, 7);
474
475     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
476     {
477       switch_buffer_by_offset_le_VV (wordr0, wordr1, wordr2, wordr3, pw_l_len);
478     }
479     else
480     {
481       switch_buffer_by_offset_le_VV (wordl0, wordl1, wordl2, wordl3, pw_r_len);
482     }
483
484     u32x w0[4];
485     u32x w1[4];
486     u32x w2[4];
487     u32x w3[4];
488
489     w0[0] = wordl0[0] | wordr0[0];
490     w0[1] = wordl0[1] | wordr0[1];
491     w0[2] = wordl0[2] | wordr0[2];
492     w0[3] = wordl0[3] | wordr0[3];
493     w1[0] = wordl1[0] | wordr1[0];
494     w1[1] = wordl1[1] | wordr1[1];
495     w1[2] = wordl1[2] | wordr1[2];
496     w1[3] = wordl1[3] | wordr1[3];
497     w2[0] = wordl2[0] | wordr2[0];
498     w2[1] = wordl2[1] | wordr2[1];
499     w2[2] = wordl2[2] | wordr2[2];
500     w2[3] = wordl2[3] | wordr2[3];
501     w3[0] = wordl3[0] | wordr3[0];
502     w3[1] = wordl3[1] | wordr3[1];
503     w3[2] = wordl3[2] | wordr3[2];
504     w3[3] = wordl3[3] | wordr3[3];
505
506     /**
507      * prepend salt
508      */
509
510     switch_buffer_by_offset_le (w0, w1, w2, w3, salt_len);
511
512     const u32x pw_salt_len = pw_len + salt_len;
513
514     w0[0] |= salt_buf0[0];
515     w0[1] |= salt_buf0[1];
516     w0[2] |= salt_buf0[2];
517     w0[3] |= salt_buf0[3];
518     w1[0] |= salt_buf1[0];
519     w1[1] |= salt_buf1[1];
520     w1[2] |= salt_buf1[2];
521     w1[3] |= salt_buf1[3];
522     w2[0] |= salt_buf2[0];
523     w2[1] |= salt_buf2[1];
524     w2[2] |= salt_buf2[2];
525     w2[3] |= salt_buf2[3];
526     w3[0] |= salt_buf3[0];
527     w3[1] |= salt_buf3[1];
528     w3[2] |= salt_buf3[2];
529     w3[3] |= salt_buf3[3];
530
531     /**
532      * append salt
533      */
534
535     u32x s0[4];
536     u32x s1[4];
537     u32x s2[4];
538     u32x s3[4];
539
540     s0[0] = salt_buf0[0];
541     s0[1] = salt_buf0[1];
542     s0[2] = salt_buf0[2];
543     s0[3] = salt_buf0[3];
544     s1[0] = salt_buf1[0];
545     s1[1] = salt_buf1[1];
546     s1[2] = salt_buf1[2];
547     s1[3] = salt_buf1[3];
548     s2[0] = salt_buf2[0];
549     s2[1] = salt_buf2[1];
550     s2[2] = salt_buf2[2];
551     s2[3] = salt_buf2[3];
552     s3[0] = salt_buf3[0];
553     s3[1] = salt_buf3[1];
554     s3[2] = salt_buf3[2];
555     s3[3] = salt_buf3[3];
556
557     switch_buffer_by_offset_le_VV (s0, s1, s2, s3, pw_salt_len);
558
559     w0[0] |= s0[0];
560     w0[1] |= s0[1];
561     w0[2] |= s0[2];
562     w0[3] |= s0[3];
563     w1[0] |= s1[0];
564     w1[1] |= s1[1];
565     w1[2] |= s1[2];
566     w1[3] |= s1[3];
567     w2[0] |= s2[0];
568     w2[1] |= s2[1];
569     w2[2] |= s2[2];
570     w2[3] |= s2[3];
571     w3[0] |= s3[0];
572     w3[1] |= s3[1];
573     w3[2] |= s3[2];
574     w3[3] |= s3[3];
575
576     const u32x salt_pw_salt_len = salt_len + pw_len + salt_len;
577
578     append_0x80_4x4_VV (w0, w1, w2, w3, salt_pw_salt_len);
579
580     /**
581      * sha1
582      */
583
584     u32x w0_t = swap32 (w0[0]);
585     u32x w1_t = swap32 (w0[1]);
586     u32x w2_t = swap32 (w0[2]);
587     u32x w3_t = swap32 (w0[3]);
588     u32x w4_t = swap32 (w1[0]);
589     u32x w5_t = swap32 (w1[1]);
590     u32x w6_t = swap32 (w1[2]);
591     u32x w7_t = swap32 (w1[3]);
592     u32x w8_t = swap32 (w2[0]);
593     u32x w9_t = swap32 (w2[1]);
594     u32x wa_t = swap32 (w2[2]);
595     u32x wb_t = swap32 (w2[3]);
596     u32x wc_t = swap32 (w3[0]);
597     u32x wd_t = swap32 (w3[1]);
598     u32x we_t = 0;
599     u32x wf_t = salt_pw_salt_len * 8;
600
601     u32x a = SHA1M_A;
602     u32x b = SHA1M_B;
603     u32x c = SHA1M_C;
604     u32x d = SHA1M_D;
605     u32x e = SHA1M_E;
606
607     #undef K
608     #define K SHA1C00
609
610     SHA1_STEP (SHA1_F0o, a, b, c, d, e, w0_t);
611     SHA1_STEP (SHA1_F0o, e, a, b, c, d, w1_t);
612     SHA1_STEP (SHA1_F0o, d, e, a, b, c, w2_t);
613     SHA1_STEP (SHA1_F0o, c, d, e, a, b, w3_t);
614     SHA1_STEP (SHA1_F0o, b, c, d, e, a, w4_t);
615     SHA1_STEP (SHA1_F0o, a, b, c, d, e, w5_t);
616     SHA1_STEP (SHA1_F0o, e, a, b, c, d, w6_t);
617     SHA1_STEP (SHA1_F0o, d, e, a, b, c, w7_t);
618     SHA1_STEP (SHA1_F0o, c, d, e, a, b, w8_t);
619     SHA1_STEP (SHA1_F0o, b, c, d, e, a, w9_t);
620     SHA1_STEP (SHA1_F0o, a, b, c, d, e, wa_t);
621     SHA1_STEP (SHA1_F0o, e, a, b, c, d, wb_t);
622     SHA1_STEP (SHA1_F0o, d, e, a, b, c, wc_t);
623     SHA1_STEP (SHA1_F0o, c, d, e, a, b, wd_t);
624     SHA1_STEP (SHA1_F0o, b, c, d, e, a, we_t);
625     SHA1_STEP (SHA1_F0o, a, b, c, d, e, wf_t);
626     w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F0o, e, a, b, c, d, w0_t);
627     w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F0o, d, e, a, b, c, w1_t);
628     w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F0o, c, d, e, a, b, w2_t);
629     w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F0o, b, c, d, e, a, w3_t);
630
631     #undef K
632     #define K SHA1C01
633
634     w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w4_t);
635     w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, w5_t);
636     w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w6_t);
637     w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w7_t);
638     w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w8_t);
639     w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w9_t);
640     wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, wa_t);
641     wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, wb_t);
642     wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, wc_t);
643     wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, wd_t);
644     we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, we_t);
645     wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, wf_t);
646     w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w0_t);
647     w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w1_t);
648     w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w2_t);
649     w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w3_t);
650     w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, w4_t);
651     w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w5_t);
652     w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w6_t);
653     w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w7_t);
654
655     #undef K
656     #define K SHA1C02
657
658     w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, a, b, c, d, e, w8_t);
659     w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, e, a, b, c, d, w9_t);
660     wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, d, e, a, b, c, wa_t);
661     wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, c, d, e, a, b, wb_t);
662     wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F2o, b, c, d, e, a, wc_t);
663     wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F2o, a, b, c, d, e, wd_t);
664     we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F2o, e, a, b, c, d, we_t);
665     wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F2o, d, e, a, b, c, wf_t);
666     w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F2o, c, d, e, a, b, w0_t);
667     w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F2o, b, c, d, e, a, w1_t);
668     w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F2o, a, b, c, d, e, w2_t);
669     w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F2o, e, a, b, c, d, w3_t);
670     w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F2o, d, e, a, b, c, w4_t);
671     w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F2o, c, d, e, a, b, w5_t);
672     w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F2o, b, c, d, e, a, w6_t);
673     w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F2o, a, b, c, d, e, w7_t);
674     w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, e, a, b, c, d, w8_t);
675     w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, d, e, a, b, c, w9_t);
676     wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, c, d, e, a, b, wa_t);
677     wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, b, c, d, e, a, wb_t);
678
679     #undef K
680     #define K SHA1C03
681
682     wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, wc_t);
683     wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, wd_t);
684     we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, we_t);
685     wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, wf_t);
686     w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w0_t);
687     w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w1_t);
688     w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, w2_t);
689     w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w3_t);
690     w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w4_t);
691     w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, w5_t);
692     w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, w6_t);
693     w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, w7_t);
694     w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, w8_t);
695     w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, w9_t);
696     wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, wa_t);
697     wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, a, b, c, d, e, wb_t);
698
699     if (MATCHES_NONE_VS (e, e_rev)) continue;
700
701     wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, e, a, b, c, d, wc_t);
702     wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, d, e, a, b, c, wd_t);
703     we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, c, d, e, a, b, we_t);
704     wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, b, c, d, e, a, wf_t);
705
706     COMPARE_S_SIMD (d, e, c, b);
707   }
708 }
709
710 __kernel void m04900_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
711 {
712 }
713
714 __kernel void m04900_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV0_buf, __global u32 *d_scryptV1_buf, __global u32 *d_scryptV2_buf, __global u32 *d_scryptV3_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
715 {
716 }