Fixed all gpu code (see PR #179 for details)
[hashcat.git] / OpenCL / m02710_a3.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _MD5_
9
10 #define NEW_SIMD_CODE
11
12 #include "include/constants.h"
13 #include "include/kernel_vendor.h"
14
15 #define DGST_R0 0
16 #define DGST_R1 3
17 #define DGST_R2 2
18 #define DGST_R3 1
19
20 #include "include/kernel_functions.c"
21 #include "OpenCL/types_ocl.c"
22 #include "OpenCL/common.c"
23 #include "OpenCL/simd.c"
24
25 #if   VECT_SIZE == 1
26 #define uint_to_hex_lower8(i) (u32x) (l_bin2asc[(i)])
27 #elif VECT_SIZE == 2
28 #define uint_to_hex_lower8(i) (u32x) (l_bin2asc[(i).s0], l_bin2asc[(i).s1])
29 #elif VECT_SIZE == 4
30 #define uint_to_hex_lower8(i) (u32x) (l_bin2asc[(i).s0], l_bin2asc[(i).s1], l_bin2asc[(i).s2], l_bin2asc[(i).s3])
31 #elif VECT_SIZE == 8
32 #define uint_to_hex_lower8(i) (u32x) (l_bin2asc[(i).s0], l_bin2asc[(i).s1], l_bin2asc[(i).s2], l_bin2asc[(i).s3], l_bin2asc[(i).s4], l_bin2asc[(i).s5], l_bin2asc[(i).s6], l_bin2asc[(i).s7])
33 #endif
34
35 static void m02710m (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, __local u32 *l_bin2asc)
36 {
37   /**
38    * modifier
39    */
40
41   const u32 gid = get_global_id (0);
42   const u32 lid = get_local_id (0);
43
44   /**
45    * salt
46    */
47
48   u32 s[8];
49
50   s[0] = salt_bufs[salt_pos].salt_buf[0];
51   s[1] = salt_bufs[salt_pos].salt_buf[1];
52   s[2] = salt_bufs[salt_pos].salt_buf[2];
53   s[3] = salt_bufs[salt_pos].salt_buf[3];
54   s[4] = salt_bufs[salt_pos].salt_buf[4];
55   s[5] = salt_bufs[salt_pos].salt_buf[5];
56   s[6] = salt_bufs[salt_pos].salt_buf[6];
57   s[7] = salt_bufs[salt_pos].salt_buf[7];
58
59   const u32 salt_len = salt_bufs[salt_pos].salt_len;
60
61   const u32 r_14 = (32 + salt_len) * 8;
62
63   /**
64    * loop
65    */
66
67   u32 w0l = w0[0];
68
69   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos += VECT_SIZE)
70   {
71     const u32x w0r = w0r_create_bft (bfs_buf, il_pos);
72
73     const u32x w0lr = w0l | w0r;
74
75     u32x w0_t[4];
76
77     w0_t[0] = w0lr;
78     w0_t[1] = w0[1];
79     w0_t[2] = w0[2];
80     w0_t[3] = w0[3];
81
82     u32x w1_t[4];
83
84     w1_t[0] = w1[0];
85     w1_t[1] = w1[1];
86     w1_t[2] = w1[2];
87     w1_t[3] = w1[3];
88
89     u32x w2_t[4];
90
91     w2_t[0] = w2[0];
92     w2_t[1] = w2[1];
93     w2_t[2] = w2[2];
94     w2_t[3] = w2[3];
95
96     u32x w3_t[4];
97
98     w3_t[0] = w3[0];
99     w3_t[1] = w3[1];
100     w3_t[2] = w3[2];
101     w3_t[3] = w3[3];
102
103     u32x a = MD5M_A;
104     u32x b = MD5M_B;
105     u32x c = MD5M_C;
106     u32x d = MD5M_D;
107
108     MD5_STEP (MD5_Fo, a, b, c, d, w0_t[0], MD5C00, MD5S00);
109     MD5_STEP (MD5_Fo, d, a, b, c, w0_t[1], MD5C01, MD5S01);
110     MD5_STEP (MD5_Fo, c, d, a, b, w0_t[2], MD5C02, MD5S02);
111     MD5_STEP (MD5_Fo, b, c, d, a, w0_t[3], MD5C03, MD5S03);
112     MD5_STEP (MD5_Fo, a, b, c, d, w1_t[0], MD5C04, MD5S00);
113     MD5_STEP (MD5_Fo, d, a, b, c, w1_t[1], MD5C05, MD5S01);
114     MD5_STEP (MD5_Fo, c, d, a, b, w1_t[2], MD5C06, MD5S02);
115     MD5_STEP (MD5_Fo, b, c, d, a, w1_t[3], MD5C07, MD5S03);
116     MD5_STEP (MD5_Fo, a, b, c, d, w2_t[0], MD5C08, MD5S00);
117     MD5_STEP (MD5_Fo, d, a, b, c, w2_t[1], MD5C09, MD5S01);
118     MD5_STEP (MD5_Fo, c, d, a, b, w2_t[2], MD5C0a, MD5S02);
119     MD5_STEP (MD5_Fo, b, c, d, a, w2_t[3], MD5C0b, MD5S03);
120     MD5_STEP (MD5_Fo, a, b, c, d, w3_t[0], MD5C0c, MD5S00);
121     MD5_STEP (MD5_Fo, d, a, b, c, w3_t[1], MD5C0d, MD5S01);
122     MD5_STEP (MD5_Fo, c, d, a, b, w3_t[2], MD5C0e, MD5S02);
123     MD5_STEP (MD5_Fo, b, c, d, a, w3_t[3], MD5C0f, MD5S03);
124
125     MD5_STEP (MD5_Go, a, b, c, d, w0_t[1], MD5C10, MD5S10);
126     MD5_STEP (MD5_Go, d, a, b, c, w1_t[2], MD5C11, MD5S11);
127     MD5_STEP (MD5_Go, c, d, a, b, w2_t[3], MD5C12, MD5S12);
128     MD5_STEP (MD5_Go, b, c, d, a, w0_t[0], MD5C13, MD5S13);
129     MD5_STEP (MD5_Go, a, b, c, d, w1_t[1], MD5C14, MD5S10);
130     MD5_STEP (MD5_Go, d, a, b, c, w2_t[2], MD5C15, MD5S11);
131     MD5_STEP (MD5_Go, c, d, a, b, w3_t[3], MD5C16, MD5S12);
132     MD5_STEP (MD5_Go, b, c, d, a, w1_t[0], MD5C17, MD5S13);
133     MD5_STEP (MD5_Go, a, b, c, d, w2_t[1], MD5C18, MD5S10);
134     MD5_STEP (MD5_Go, d, a, b, c, w3_t[2], MD5C19, MD5S11);
135     MD5_STEP (MD5_Go, c, d, a, b, w0_t[3], MD5C1a, MD5S12);
136     MD5_STEP (MD5_Go, b, c, d, a, w2_t[0], MD5C1b, MD5S13);
137     MD5_STEP (MD5_Go, a, b, c, d, w3_t[1], MD5C1c, MD5S10);
138     MD5_STEP (MD5_Go, d, a, b, c, w0_t[2], MD5C1d, MD5S11);
139     MD5_STEP (MD5_Go, c, d, a, b, w1_t[3], MD5C1e, MD5S12);
140     MD5_STEP (MD5_Go, b, c, d, a, w3_t[0], MD5C1f, MD5S13);
141
142     MD5_STEP (MD5_H , a, b, c, d, w1_t[1], MD5C20, MD5S20);
143     MD5_STEP (MD5_H , d, a, b, c, w2_t[0], MD5C21, MD5S21);
144     MD5_STEP (MD5_H , c, d, a, b, w2_t[3], MD5C22, MD5S22);
145     MD5_STEP (MD5_H , b, c, d, a, w3_t[2], MD5C23, MD5S23);
146     MD5_STEP (MD5_H , a, b, c, d, w0_t[1], MD5C24, MD5S20);
147     MD5_STEP (MD5_H , d, a, b, c, w1_t[0], MD5C25, MD5S21);
148     MD5_STEP (MD5_H , c, d, a, b, w1_t[3], MD5C26, MD5S22);
149     MD5_STEP (MD5_H , b, c, d, a, w2_t[2], MD5C27, MD5S23);
150     MD5_STEP (MD5_H , a, b, c, d, w3_t[1], MD5C28, MD5S20);
151     MD5_STEP (MD5_H , d, a, b, c, w0_t[0], MD5C29, MD5S21);
152     MD5_STEP (MD5_H , c, d, a, b, w0_t[3], MD5C2a, MD5S22);
153     MD5_STEP (MD5_H , b, c, d, a, w1_t[2], MD5C2b, MD5S23);
154     MD5_STEP (MD5_H , a, b, c, d, w2_t[1], MD5C2c, MD5S20);
155     MD5_STEP (MD5_H , d, a, b, c, w3_t[0], MD5C2d, MD5S21);
156     MD5_STEP (MD5_H , c, d, a, b, w3_t[3], MD5C2e, MD5S22);
157     MD5_STEP (MD5_H , b, c, d, a, w0_t[2], MD5C2f, MD5S23);
158
159     MD5_STEP (MD5_I , a, b, c, d, w0_t[0], MD5C30, MD5S30);
160     MD5_STEP (MD5_I , d, a, b, c, w1_t[3], MD5C31, MD5S31);
161     MD5_STEP (MD5_I , c, d, a, b, w3_t[2], MD5C32, MD5S32);
162     MD5_STEP (MD5_I , b, c, d, a, w1_t[1], MD5C33, MD5S33);
163     MD5_STEP (MD5_I , a, b, c, d, w3_t[0], MD5C34, MD5S30);
164     MD5_STEP (MD5_I , d, a, b, c, w0_t[3], MD5C35, MD5S31);
165     MD5_STEP (MD5_I , c, d, a, b, w2_t[2], MD5C36, MD5S32);
166     MD5_STEP (MD5_I , b, c, d, a, w0_t[1], MD5C37, MD5S33);
167     MD5_STEP (MD5_I , a, b, c, d, w2_t[0], MD5C38, MD5S30);
168     MD5_STEP (MD5_I , d, a, b, c, w3_t[3], MD5C39, MD5S31);
169     MD5_STEP (MD5_I , c, d, a, b, w1_t[2], MD5C3a, MD5S32);
170     MD5_STEP (MD5_I , b, c, d, a, w3_t[1], MD5C3b, MD5S33);
171     MD5_STEP (MD5_I , a, b, c, d, w1_t[0], MD5C3c, MD5S30);
172     MD5_STEP (MD5_I , d, a, b, c, w2_t[3], MD5C3d, MD5S31);
173     MD5_STEP (MD5_I , c, d, a, b, w0_t[2], MD5C3e, MD5S32);
174     MD5_STEP (MD5_I , b, c, d, a, w2_t[1], MD5C3f, MD5S33);
175
176     a += MD5M_A;
177     b += MD5M_B;
178     c += MD5M_C;
179     d += MD5M_D;
180
181     w0_t[0] = uint_to_hex_lower8 ((a >>  0) & 255) <<  0
182             | uint_to_hex_lower8 ((a >>  8) & 255) << 16;
183     w0_t[1] = uint_to_hex_lower8 ((a >> 16) & 255) <<  0
184             | uint_to_hex_lower8 ((a >> 24) & 255) << 16;
185     w0_t[2] = uint_to_hex_lower8 ((b >>  0) & 255) <<  0
186             | uint_to_hex_lower8 ((b >>  8) & 255) << 16;
187     w0_t[3] = uint_to_hex_lower8 ((b >> 16) & 255) <<  0
188             | uint_to_hex_lower8 ((b >> 24) & 255) << 16;
189     w1_t[0] = uint_to_hex_lower8 ((c >>  0) & 255) <<  0
190             | uint_to_hex_lower8 ((c >>  8) & 255) << 16;
191     w1_t[1] = uint_to_hex_lower8 ((c >> 16) & 255) <<  0
192             | uint_to_hex_lower8 ((c >> 24) & 255) << 16;
193     w1_t[2] = uint_to_hex_lower8 ((d >>  0) & 255) <<  0
194             | uint_to_hex_lower8 ((d >>  8) & 255) << 16;
195     w1_t[3] = uint_to_hex_lower8 ((d >> 16) & 255) <<  0
196             | uint_to_hex_lower8 ((d >> 24) & 255) << 16;
197
198     w2_t[0] = s[0];
199     w2_t[1] = s[1];
200     w2_t[2] = s[2];
201     w2_t[3] = s[3];
202
203     w3_t[0] = s[4];
204     w3_t[1] = s[5];
205     w3_t[2] = s[6];
206     w3_t[3] = s[7];
207
208     a = MD5M_A;
209     b = MD5M_B;
210     c = MD5M_C;
211     d = MD5M_D;
212
213     MD5_STEP (MD5_Fo, a, b, c, d, w0_t[0], MD5C00, MD5S00);
214     MD5_STEP (MD5_Fo, d, a, b, c, w0_t[1], MD5C01, MD5S01);
215     MD5_STEP (MD5_Fo, c, d, a, b, w0_t[2], MD5C02, MD5S02);
216     MD5_STEP (MD5_Fo, b, c, d, a, w0_t[3], MD5C03, MD5S03);
217     MD5_STEP (MD5_Fo, a, b, c, d, w1_t[0], MD5C04, MD5S00);
218     MD5_STEP (MD5_Fo, d, a, b, c, w1_t[1], MD5C05, MD5S01);
219     MD5_STEP (MD5_Fo, c, d, a, b, w1_t[2], MD5C06, MD5S02);
220     MD5_STEP (MD5_Fo, b, c, d, a, w1_t[3], MD5C07, MD5S03);
221     MD5_STEP (MD5_Fo, a, b, c, d, w2_t[0], MD5C08, MD5S00);
222     MD5_STEP (MD5_Fo, d, a, b, c, w2_t[1], MD5C09, MD5S01);
223     MD5_STEP (MD5_Fo, c, d, a, b, w2_t[2], MD5C0a, MD5S02);
224     MD5_STEP (MD5_Fo, b, c, d, a, w2_t[3], MD5C0b, MD5S03);
225     MD5_STEP (MD5_Fo, a, b, c, d, w3_t[0], MD5C0c, MD5S00);
226     MD5_STEP (MD5_Fo, d, a, b, c, w3_t[1], MD5C0d, MD5S01);
227     MD5_STEP (MD5_Fo, c, d, a, b, w3_t[2], MD5C0e, MD5S02);
228     MD5_STEP (MD5_Fo, b, c, d, a, w3_t[3], MD5C0f, MD5S03);
229
230     MD5_STEP (MD5_Go, a, b, c, d, w0_t[1], MD5C10, MD5S10);
231     MD5_STEP (MD5_Go, d, a, b, c, w1_t[2], MD5C11, MD5S11);
232     MD5_STEP (MD5_Go, c, d, a, b, w2_t[3], MD5C12, MD5S12);
233     MD5_STEP (MD5_Go, b, c, d, a, w0_t[0], MD5C13, MD5S13);
234     MD5_STEP (MD5_Go, a, b, c, d, w1_t[1], MD5C14, MD5S10);
235     MD5_STEP (MD5_Go, d, a, b, c, w2_t[2], MD5C15, MD5S11);
236     MD5_STEP (MD5_Go, c, d, a, b, w3_t[3], MD5C16, MD5S12);
237     MD5_STEP (MD5_Go, b, c, d, a, w1_t[0], MD5C17, MD5S13);
238     MD5_STEP (MD5_Go, a, b, c, d, w2_t[1], MD5C18, MD5S10);
239     MD5_STEP (MD5_Go, d, a, b, c, w3_t[2], MD5C19, MD5S11);
240     MD5_STEP (MD5_Go, c, d, a, b, w0_t[3], MD5C1a, MD5S12);
241     MD5_STEP (MD5_Go, b, c, d, a, w2_t[0], MD5C1b, MD5S13);
242     MD5_STEP (MD5_Go, a, b, c, d, w3_t[1], MD5C1c, MD5S10);
243     MD5_STEP (MD5_Go, d, a, b, c, w0_t[2], MD5C1d, MD5S11);
244     MD5_STEP (MD5_Go, c, d, a, b, w1_t[3], MD5C1e, MD5S12);
245     MD5_STEP (MD5_Go, b, c, d, a, w3_t[0], MD5C1f, MD5S13);
246
247     MD5_STEP (MD5_H , a, b, c, d, w1_t[1], MD5C20, MD5S20);
248     MD5_STEP (MD5_H , d, a, b, c, w2_t[0], MD5C21, MD5S21);
249     MD5_STEP (MD5_H , c, d, a, b, w2_t[3], MD5C22, MD5S22);
250     MD5_STEP (MD5_H , b, c, d, a, w3_t[2], MD5C23, MD5S23);
251     MD5_STEP (MD5_H , a, b, c, d, w0_t[1], MD5C24, MD5S20);
252     MD5_STEP (MD5_H , d, a, b, c, w1_t[0], MD5C25, MD5S21);
253     MD5_STEP (MD5_H , c, d, a, b, w1_t[3], MD5C26, MD5S22);
254     MD5_STEP (MD5_H , b, c, d, a, w2_t[2], MD5C27, MD5S23);
255     MD5_STEP (MD5_H , a, b, c, d, w3_t[1], MD5C28, MD5S20);
256     MD5_STEP (MD5_H , d, a, b, c, w0_t[0], MD5C29, MD5S21);
257     MD5_STEP (MD5_H , c, d, a, b, w0_t[3], MD5C2a, MD5S22);
258     MD5_STEP (MD5_H , b, c, d, a, w1_t[2], MD5C2b, MD5S23);
259     MD5_STEP (MD5_H , a, b, c, d, w2_t[1], MD5C2c, MD5S20);
260     MD5_STEP (MD5_H , d, a, b, c, w3_t[0], MD5C2d, MD5S21);
261     MD5_STEP (MD5_H , c, d, a, b, w3_t[3], MD5C2e, MD5S22);
262     MD5_STEP (MD5_H , b, c, d, a, w0_t[2], MD5C2f, MD5S23);
263
264     MD5_STEP (MD5_I , a, b, c, d, w0_t[0], MD5C30, MD5S30);
265     MD5_STEP (MD5_I , d, a, b, c, w1_t[3], MD5C31, MD5S31);
266     MD5_STEP (MD5_I , c, d, a, b, w3_t[2], MD5C32, MD5S32);
267     MD5_STEP (MD5_I , b, c, d, a, w1_t[1], MD5C33, MD5S33);
268     MD5_STEP (MD5_I , a, b, c, d, w3_t[0], MD5C34, MD5S30);
269     MD5_STEP (MD5_I , d, a, b, c, w0_t[3], MD5C35, MD5S31);
270     MD5_STEP (MD5_I , c, d, a, b, w2_t[2], MD5C36, MD5S32);
271     MD5_STEP (MD5_I , b, c, d, a, w0_t[1], MD5C37, MD5S33);
272     MD5_STEP (MD5_I , a, b, c, d, w2_t[0], MD5C38, MD5S30);
273     MD5_STEP (MD5_I , d, a, b, c, w3_t[3], MD5C39, MD5S31);
274     MD5_STEP (MD5_I , c, d, a, b, w1_t[2], MD5C3a, MD5S32);
275     MD5_STEP (MD5_I , b, c, d, a, w3_t[1], MD5C3b, MD5S33);
276     MD5_STEP (MD5_I , a, b, c, d, w1_t[0], MD5C3c, MD5S30);
277     MD5_STEP (MD5_I , d, a, b, c, w2_t[3], MD5C3d, MD5S31);
278     MD5_STEP (MD5_I , c, d, a, b, w0_t[2], MD5C3e, MD5S32);
279     MD5_STEP (MD5_I , b, c, d, a, w2_t[1], MD5C3f, MD5S33);
280
281     const u32x r_a = a + MD5M_A;
282     const u32x r_b = b + MD5M_B;
283     const u32x r_c = c + MD5M_C;
284     const u32x r_d = d + MD5M_D;
285
286     a = r_a;
287     b = r_b;
288     c = r_c;
289     d = r_d;
290
291     MD5_STEP0(MD5_Fo, a, b, c, d,       MD5C00, MD5S00);
292     MD5_STEP0(MD5_Fo, d, a, b, c,       MD5C01, MD5S01);
293     MD5_STEP0(MD5_Fo, c, d, a, b,       MD5C02, MD5S02);
294     MD5_STEP0(MD5_Fo, b, c, d, a,       MD5C03, MD5S03);
295     MD5_STEP0(MD5_Fo, a, b, c, d,       MD5C04, MD5S00);
296     MD5_STEP0(MD5_Fo, d, a, b, c,       MD5C05, MD5S01);
297     MD5_STEP0(MD5_Fo, c, d, a, b,       MD5C06, MD5S02);
298     MD5_STEP0(MD5_Fo, b, c, d, a,       MD5C07, MD5S03);
299     MD5_STEP0(MD5_Fo, a, b, c, d,       MD5C08, MD5S00);
300     MD5_STEP0(MD5_Fo, d, a, b, c,       MD5C09, MD5S01);
301     MD5_STEP0(MD5_Fo, c, d, a, b,       MD5C0a, MD5S02);
302     MD5_STEP0(MD5_Fo, b, c, d, a,       MD5C0b, MD5S03);
303     MD5_STEP0(MD5_Fo, a, b, c, d,       MD5C0c, MD5S00);
304     MD5_STEP0(MD5_Fo, d, a, b, c,       MD5C0d, MD5S01);
305     MD5_STEP (MD5_Fo, c, d, a, b, r_14, MD5C0e, MD5S02);
306     MD5_STEP0(MD5_Fo, b, c, d, a,       MD5C0f, MD5S03);
307
308     MD5_STEP0(MD5_Go, a, b, c, d,       MD5C10, MD5S10);
309     MD5_STEP0(MD5_Go, d, a, b, c,       MD5C11, MD5S11);
310     MD5_STEP0(MD5_Go, c, d, a, b,       MD5C12, MD5S12);
311     MD5_STEP0(MD5_Go, b, c, d, a,       MD5C13, MD5S13);
312     MD5_STEP0(MD5_Go, a, b, c, d,       MD5C14, MD5S10);
313     MD5_STEP0(MD5_Go, d, a, b, c,       MD5C15, MD5S11);
314     MD5_STEP0(MD5_Go, c, d, a, b,       MD5C16, MD5S12);
315     MD5_STEP0(MD5_Go, b, c, d, a,       MD5C17, MD5S13);
316     MD5_STEP0(MD5_Go, a, b, c, d,       MD5C18, MD5S10);
317     MD5_STEP (MD5_Go, d, a, b, c, r_14, MD5C19, MD5S11);
318     MD5_STEP0(MD5_Go, c, d, a, b,       MD5C1a, MD5S12);
319     MD5_STEP0(MD5_Go, b, c, d, a,       MD5C1b, MD5S13);
320     MD5_STEP0(MD5_Go, a, b, c, d,       MD5C1c, MD5S10);
321     MD5_STEP0(MD5_Go, d, a, b, c,       MD5C1d, MD5S11);
322     MD5_STEP0(MD5_Go, c, d, a, b,       MD5C1e, MD5S12);
323     MD5_STEP0(MD5_Go, b, c, d, a,       MD5C1f, MD5S13);
324
325     MD5_STEP0(MD5_H , a, b, c, d,       MD5C20, MD5S20);
326     MD5_STEP0(MD5_H , d, a, b, c,       MD5C21, MD5S21);
327     MD5_STEP0(MD5_H , c, d, a, b,       MD5C22, MD5S22);
328     MD5_STEP (MD5_H , b, c, d, a, r_14, MD5C23, MD5S23);
329     MD5_STEP0(MD5_H , a, b, c, d,       MD5C24, MD5S20);
330     MD5_STEP0(MD5_H , d, a, b, c,       MD5C25, MD5S21);
331     MD5_STEP0(MD5_H , c, d, a, b,       MD5C26, MD5S22);
332     MD5_STEP0(MD5_H , b, c, d, a,       MD5C27, MD5S23);
333     MD5_STEP0(MD5_H , a, b, c, d,       MD5C28, MD5S20);
334     MD5_STEP0(MD5_H , d, a, b, c,       MD5C29, MD5S21);
335     MD5_STEP0(MD5_H , c, d, a, b,       MD5C2a, MD5S22);
336     MD5_STEP0(MD5_H , b, c, d, a,       MD5C2b, MD5S23);
337     MD5_STEP0(MD5_H , a, b, c, d,       MD5C2c, MD5S20);
338     MD5_STEP0(MD5_H , d, a, b, c,       MD5C2d, MD5S21);
339     MD5_STEP0(MD5_H , c, d, a, b,       MD5C2e, MD5S22);
340     MD5_STEP0(MD5_H , b, c, d, a,       MD5C2f, MD5S23);
341
342     MD5_STEP0(MD5_I , a, b, c, d,       MD5C30, MD5S30);
343     MD5_STEP0(MD5_I , d, a, b, c,       MD5C31, MD5S31);
344     MD5_STEP (MD5_I , c, d, a, b, r_14, MD5C32, MD5S32);
345     MD5_STEP0(MD5_I , b, c, d, a,       MD5C33, MD5S33);
346     MD5_STEP0(MD5_I , a, b, c, d,       MD5C34, MD5S30);
347     MD5_STEP0(MD5_I , d, a, b, c,       MD5C35, MD5S31);
348     MD5_STEP0(MD5_I , c, d, a, b,       MD5C36, MD5S32);
349     MD5_STEP0(MD5_I , b, c, d, a,       MD5C37, MD5S33);
350     MD5_STEP0(MD5_I , a, b, c, d,       MD5C38, MD5S30);
351     MD5_STEP0(MD5_I , d, a, b, c,       MD5C39, MD5S31);
352     MD5_STEP0(MD5_I , c, d, a, b,       MD5C3a, MD5S32);
353     MD5_STEP0(MD5_I , b, c, d, a,       MD5C3b, MD5S33);
354     MD5_STEP0(MD5_I , a, b, c, d,       MD5C3c, MD5S30);
355     MD5_STEP0(MD5_I , d, a, b, c,       MD5C3d, MD5S31);
356     MD5_STEP0(MD5_I , c, d, a, b,       MD5C3e, MD5S32);
357     MD5_STEP0(MD5_I , b, c, d, a,       MD5C3f, MD5S33);
358
359     a += r_a;
360     b += r_b;
361     c += r_c;
362     d += r_d;
363
364     COMPARE_M_SIMD (a, d, c, b);
365   }
366 }
367
368 static void m02710s (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], const u32 pw_len, __global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, __local u32 *l_bin2asc)
369 {
370   /**
371    * modifier
372    */
373
374   const u32 gid = get_global_id (0);
375   const u32 lid = get_local_id (0);
376
377   /**
378    * digest
379    */
380
381   const u32 search[4] =
382   {
383     digests_buf[digests_offset].digest_buf[DGST_R0],
384     digests_buf[digests_offset].digest_buf[DGST_R1],
385     digests_buf[digests_offset].digest_buf[DGST_R2],
386     digests_buf[digests_offset].digest_buf[DGST_R3]
387   };
388
389   /**
390    * salt
391    */
392
393   u32 s[8];
394
395   s[0] = salt_bufs[salt_pos].salt_buf[0];
396   s[1] = salt_bufs[salt_pos].salt_buf[1];
397   s[2] = salt_bufs[salt_pos].salt_buf[2];
398   s[3] = salt_bufs[salt_pos].salt_buf[3];
399   s[4] = salt_bufs[salt_pos].salt_buf[4];
400   s[5] = salt_bufs[salt_pos].salt_buf[5];
401   s[6] = salt_bufs[salt_pos].salt_buf[6];
402   s[7] = salt_bufs[salt_pos].salt_buf[7];
403
404   const u32 salt_len = salt_bufs[salt_pos].salt_len;
405
406   const u32 r_14 = (32 + salt_len) * 8;
407
408   /**
409    * loop
410    */
411
412   u32 w0l = w0[0];
413
414   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos += VECT_SIZE)
415   {
416     const u32x w0r = w0r_create_bft (bfs_buf, il_pos);
417
418     const u32x w0lr = w0l | w0r;
419
420     u32x w0_t[4];
421
422     w0_t[0] = w0lr;
423     w0_t[1] = w0[1];
424     w0_t[2] = w0[2];
425     w0_t[3] = w0[3];
426
427     u32x w1_t[4];
428
429     w1_t[0] = w1[0];
430     w1_t[1] = w1[1];
431     w1_t[2] = w1[2];
432     w1_t[3] = w1[3];
433
434     u32x w2_t[4];
435
436     w2_t[0] = w2[0];
437     w2_t[1] = w2[1];
438     w2_t[2] = w2[2];
439     w2_t[3] = w2[3];
440
441     u32x w3_t[4];
442
443     w3_t[0] = w3[0];
444     w3_t[1] = w3[1];
445     w3_t[2] = w3[2];
446     w3_t[3] = w3[3];
447
448     u32x a = MD5M_A;
449     u32x b = MD5M_B;
450     u32x c = MD5M_C;
451     u32x d = MD5M_D;
452
453     MD5_STEP (MD5_Fo, a, b, c, d, w0_t[0], MD5C00, MD5S00);
454     MD5_STEP (MD5_Fo, d, a, b, c, w0_t[1], MD5C01, MD5S01);
455     MD5_STEP (MD5_Fo, c, d, a, b, w0_t[2], MD5C02, MD5S02);
456     MD5_STEP (MD5_Fo, b, c, d, a, w0_t[3], MD5C03, MD5S03);
457     MD5_STEP (MD5_Fo, a, b, c, d, w1_t[0], MD5C04, MD5S00);
458     MD5_STEP (MD5_Fo, d, a, b, c, w1_t[1], MD5C05, MD5S01);
459     MD5_STEP (MD5_Fo, c, d, a, b, w1_t[2], MD5C06, MD5S02);
460     MD5_STEP (MD5_Fo, b, c, d, a, w1_t[3], MD5C07, MD5S03);
461     MD5_STEP (MD5_Fo, a, b, c, d, w2_t[0], MD5C08, MD5S00);
462     MD5_STEP (MD5_Fo, d, a, b, c, w2_t[1], MD5C09, MD5S01);
463     MD5_STEP (MD5_Fo, c, d, a, b, w2_t[2], MD5C0a, MD5S02);
464     MD5_STEP (MD5_Fo, b, c, d, a, w2_t[3], MD5C0b, MD5S03);
465     MD5_STEP (MD5_Fo, a, b, c, d, w3_t[0], MD5C0c, MD5S00);
466     MD5_STEP (MD5_Fo, d, a, b, c, w3_t[1], MD5C0d, MD5S01);
467     MD5_STEP (MD5_Fo, c, d, a, b, w3_t[2], MD5C0e, MD5S02);
468     MD5_STEP (MD5_Fo, b, c, d, a, w3_t[3], MD5C0f, MD5S03);
469
470     MD5_STEP (MD5_Go, a, b, c, d, w0_t[1], MD5C10, MD5S10);
471     MD5_STEP (MD5_Go, d, a, b, c, w1_t[2], MD5C11, MD5S11);
472     MD5_STEP (MD5_Go, c, d, a, b, w2_t[3], MD5C12, MD5S12);
473     MD5_STEP (MD5_Go, b, c, d, a, w0_t[0], MD5C13, MD5S13);
474     MD5_STEP (MD5_Go, a, b, c, d, w1_t[1], MD5C14, MD5S10);
475     MD5_STEP (MD5_Go, d, a, b, c, w2_t[2], MD5C15, MD5S11);
476     MD5_STEP (MD5_Go, c, d, a, b, w3_t[3], MD5C16, MD5S12);
477     MD5_STEP (MD5_Go, b, c, d, a, w1_t[0], MD5C17, MD5S13);
478     MD5_STEP (MD5_Go, a, b, c, d, w2_t[1], MD5C18, MD5S10);
479     MD5_STEP (MD5_Go, d, a, b, c, w3_t[2], MD5C19, MD5S11);
480     MD5_STEP (MD5_Go, c, d, a, b, w0_t[3], MD5C1a, MD5S12);
481     MD5_STEP (MD5_Go, b, c, d, a, w2_t[0], MD5C1b, MD5S13);
482     MD5_STEP (MD5_Go, a, b, c, d, w3_t[1], MD5C1c, MD5S10);
483     MD5_STEP (MD5_Go, d, a, b, c, w0_t[2], MD5C1d, MD5S11);
484     MD5_STEP (MD5_Go, c, d, a, b, w1_t[3], MD5C1e, MD5S12);
485     MD5_STEP (MD5_Go, b, c, d, a, w3_t[0], MD5C1f, MD5S13);
486
487     MD5_STEP (MD5_H , a, b, c, d, w1_t[1], MD5C20, MD5S20);
488     MD5_STEP (MD5_H , d, a, b, c, w2_t[0], MD5C21, MD5S21);
489     MD5_STEP (MD5_H , c, d, a, b, w2_t[3], MD5C22, MD5S22);
490     MD5_STEP (MD5_H , b, c, d, a, w3_t[2], MD5C23, MD5S23);
491     MD5_STEP (MD5_H , a, b, c, d, w0_t[1], MD5C24, MD5S20);
492     MD5_STEP (MD5_H , d, a, b, c, w1_t[0], MD5C25, MD5S21);
493     MD5_STEP (MD5_H , c, d, a, b, w1_t[3], MD5C26, MD5S22);
494     MD5_STEP (MD5_H , b, c, d, a, w2_t[2], MD5C27, MD5S23);
495     MD5_STEP (MD5_H , a, b, c, d, w3_t[1], MD5C28, MD5S20);
496     MD5_STEP (MD5_H , d, a, b, c, w0_t[0], MD5C29, MD5S21);
497     MD5_STEP (MD5_H , c, d, a, b, w0_t[3], MD5C2a, MD5S22);
498     MD5_STEP (MD5_H , b, c, d, a, w1_t[2], MD5C2b, MD5S23);
499     MD5_STEP (MD5_H , a, b, c, d, w2_t[1], MD5C2c, MD5S20);
500     MD5_STEP (MD5_H , d, a, b, c, w3_t[0], MD5C2d, MD5S21);
501     MD5_STEP (MD5_H , c, d, a, b, w3_t[3], MD5C2e, MD5S22);
502     MD5_STEP (MD5_H , b, c, d, a, w0_t[2], MD5C2f, MD5S23);
503
504     MD5_STEP (MD5_I , a, b, c, d, w0_t[0], MD5C30, MD5S30);
505     MD5_STEP (MD5_I , d, a, b, c, w1_t[3], MD5C31, MD5S31);
506     MD5_STEP (MD5_I , c, d, a, b, w3_t[2], MD5C32, MD5S32);
507     MD5_STEP (MD5_I , b, c, d, a, w1_t[1], MD5C33, MD5S33);
508     MD5_STEP (MD5_I , a, b, c, d, w3_t[0], MD5C34, MD5S30);
509     MD5_STEP (MD5_I , d, a, b, c, w0_t[3], MD5C35, MD5S31);
510     MD5_STEP (MD5_I , c, d, a, b, w2_t[2], MD5C36, MD5S32);
511     MD5_STEP (MD5_I , b, c, d, a, w0_t[1], MD5C37, MD5S33);
512     MD5_STEP (MD5_I , a, b, c, d, w2_t[0], MD5C38, MD5S30);
513     MD5_STEP (MD5_I , d, a, b, c, w3_t[3], MD5C39, MD5S31);
514     MD5_STEP (MD5_I , c, d, a, b, w1_t[2], MD5C3a, MD5S32);
515     MD5_STEP (MD5_I , b, c, d, a, w3_t[1], MD5C3b, MD5S33);
516     MD5_STEP (MD5_I , a, b, c, d, w1_t[0], MD5C3c, MD5S30);
517     MD5_STEP (MD5_I , d, a, b, c, w2_t[3], MD5C3d, MD5S31);
518     MD5_STEP (MD5_I , c, d, a, b, w0_t[2], MD5C3e, MD5S32);
519     MD5_STEP (MD5_I , b, c, d, a, w2_t[1], MD5C3f, MD5S33);
520
521     a += MD5M_A;
522     b += MD5M_B;
523     c += MD5M_C;
524     d += MD5M_D;
525
526     w0_t[0] = uint_to_hex_lower8 ((a >>  0) & 255) <<  0
527             | uint_to_hex_lower8 ((a >>  8) & 255) << 16;
528     w0_t[1] = uint_to_hex_lower8 ((a >> 16) & 255) <<  0
529             | uint_to_hex_lower8 ((a >> 24) & 255) << 16;
530     w0_t[2] = uint_to_hex_lower8 ((b >>  0) & 255) <<  0
531             | uint_to_hex_lower8 ((b >>  8) & 255) << 16;
532     w0_t[3] = uint_to_hex_lower8 ((b >> 16) & 255) <<  0
533             | uint_to_hex_lower8 ((b >> 24) & 255) << 16;
534     w1_t[0] = uint_to_hex_lower8 ((c >>  0) & 255) <<  0
535             | uint_to_hex_lower8 ((c >>  8) & 255) << 16;
536     w1_t[1] = uint_to_hex_lower8 ((c >> 16) & 255) <<  0
537             | uint_to_hex_lower8 ((c >> 24) & 255) << 16;
538     w1_t[2] = uint_to_hex_lower8 ((d >>  0) & 255) <<  0
539             | uint_to_hex_lower8 ((d >>  8) & 255) << 16;
540     w1_t[3] = uint_to_hex_lower8 ((d >> 16) & 255) <<  0
541             | uint_to_hex_lower8 ((d >> 24) & 255) << 16;
542
543     w2_t[0] = s[0];
544     w2_t[1] = s[1];
545     w2_t[2] = s[2];
546     w2_t[3] = s[3];
547
548     w3_t[0] = s[4];
549     w3_t[1] = s[5];
550     w3_t[2] = s[6];
551     w3_t[3] = s[7];
552
553     a = MD5M_A;
554     b = MD5M_B;
555     c = MD5M_C;
556     d = MD5M_D;
557
558     MD5_STEP (MD5_Fo, a, b, c, d, w0_t[0], MD5C00, MD5S00);
559     MD5_STEP (MD5_Fo, d, a, b, c, w0_t[1], MD5C01, MD5S01);
560     MD5_STEP (MD5_Fo, c, d, a, b, w0_t[2], MD5C02, MD5S02);
561     MD5_STEP (MD5_Fo, b, c, d, a, w0_t[3], MD5C03, MD5S03);
562     MD5_STEP (MD5_Fo, a, b, c, d, w1_t[0], MD5C04, MD5S00);
563     MD5_STEP (MD5_Fo, d, a, b, c, w1_t[1], MD5C05, MD5S01);
564     MD5_STEP (MD5_Fo, c, d, a, b, w1_t[2], MD5C06, MD5S02);
565     MD5_STEP (MD5_Fo, b, c, d, a, w1_t[3], MD5C07, MD5S03);
566     MD5_STEP (MD5_Fo, a, b, c, d, w2_t[0], MD5C08, MD5S00);
567     MD5_STEP (MD5_Fo, d, a, b, c, w2_t[1], MD5C09, MD5S01);
568     MD5_STEP (MD5_Fo, c, d, a, b, w2_t[2], MD5C0a, MD5S02);
569     MD5_STEP (MD5_Fo, b, c, d, a, w2_t[3], MD5C0b, MD5S03);
570     MD5_STEP (MD5_Fo, a, b, c, d, w3_t[0], MD5C0c, MD5S00);
571     MD5_STEP (MD5_Fo, d, a, b, c, w3_t[1], MD5C0d, MD5S01);
572     MD5_STEP (MD5_Fo, c, d, a, b, w3_t[2], MD5C0e, MD5S02);
573     MD5_STEP (MD5_Fo, b, c, d, a, w3_t[3], MD5C0f, MD5S03);
574
575     MD5_STEP (MD5_Go, a, b, c, d, w0_t[1], MD5C10, MD5S10);
576     MD5_STEP (MD5_Go, d, a, b, c, w1_t[2], MD5C11, MD5S11);
577     MD5_STEP (MD5_Go, c, d, a, b, w2_t[3], MD5C12, MD5S12);
578     MD5_STEP (MD5_Go, b, c, d, a, w0_t[0], MD5C13, MD5S13);
579     MD5_STEP (MD5_Go, a, b, c, d, w1_t[1], MD5C14, MD5S10);
580     MD5_STEP (MD5_Go, d, a, b, c, w2_t[2], MD5C15, MD5S11);
581     MD5_STEP (MD5_Go, c, d, a, b, w3_t[3], MD5C16, MD5S12);
582     MD5_STEP (MD5_Go, b, c, d, a, w1_t[0], MD5C17, MD5S13);
583     MD5_STEP (MD5_Go, a, b, c, d, w2_t[1], MD5C18, MD5S10);
584     MD5_STEP (MD5_Go, d, a, b, c, w3_t[2], MD5C19, MD5S11);
585     MD5_STEP (MD5_Go, c, d, a, b, w0_t[3], MD5C1a, MD5S12);
586     MD5_STEP (MD5_Go, b, c, d, a, w2_t[0], MD5C1b, MD5S13);
587     MD5_STEP (MD5_Go, a, b, c, d, w3_t[1], MD5C1c, MD5S10);
588     MD5_STEP (MD5_Go, d, a, b, c, w0_t[2], MD5C1d, MD5S11);
589     MD5_STEP (MD5_Go, c, d, a, b, w1_t[3], MD5C1e, MD5S12);
590     MD5_STEP (MD5_Go, b, c, d, a, w3_t[0], MD5C1f, MD5S13);
591
592     MD5_STEP (MD5_H , a, b, c, d, w1_t[1], MD5C20, MD5S20);
593     MD5_STEP (MD5_H , d, a, b, c, w2_t[0], MD5C21, MD5S21);
594     MD5_STEP (MD5_H , c, d, a, b, w2_t[3], MD5C22, MD5S22);
595     MD5_STEP (MD5_H , b, c, d, a, w3_t[2], MD5C23, MD5S23);
596     MD5_STEP (MD5_H , a, b, c, d, w0_t[1], MD5C24, MD5S20);
597     MD5_STEP (MD5_H , d, a, b, c, w1_t[0], MD5C25, MD5S21);
598     MD5_STEP (MD5_H , c, d, a, b, w1_t[3], MD5C26, MD5S22);
599     MD5_STEP (MD5_H , b, c, d, a, w2_t[2], MD5C27, MD5S23);
600     MD5_STEP (MD5_H , a, b, c, d, w3_t[1], MD5C28, MD5S20);
601     MD5_STEP (MD5_H , d, a, b, c, w0_t[0], MD5C29, MD5S21);
602     MD5_STEP (MD5_H , c, d, a, b, w0_t[3], MD5C2a, MD5S22);
603     MD5_STEP (MD5_H , b, c, d, a, w1_t[2], MD5C2b, MD5S23);
604     MD5_STEP (MD5_H , a, b, c, d, w2_t[1], MD5C2c, MD5S20);
605     MD5_STEP (MD5_H , d, a, b, c, w3_t[0], MD5C2d, MD5S21);
606     MD5_STEP (MD5_H , c, d, a, b, w3_t[3], MD5C2e, MD5S22);
607     MD5_STEP (MD5_H , b, c, d, a, w0_t[2], MD5C2f, MD5S23);
608
609     MD5_STEP (MD5_I , a, b, c, d, w0_t[0], MD5C30, MD5S30);
610     MD5_STEP (MD5_I , d, a, b, c, w1_t[3], MD5C31, MD5S31);
611     MD5_STEP (MD5_I , c, d, a, b, w3_t[2], MD5C32, MD5S32);
612     MD5_STEP (MD5_I , b, c, d, a, w1_t[1], MD5C33, MD5S33);
613     MD5_STEP (MD5_I , a, b, c, d, w3_t[0], MD5C34, MD5S30);
614     MD5_STEP (MD5_I , d, a, b, c, w0_t[3], MD5C35, MD5S31);
615     MD5_STEP (MD5_I , c, d, a, b, w2_t[2], MD5C36, MD5S32);
616     MD5_STEP (MD5_I , b, c, d, a, w0_t[1], MD5C37, MD5S33);
617     MD5_STEP (MD5_I , a, b, c, d, w2_t[0], MD5C38, MD5S30);
618     MD5_STEP (MD5_I , d, a, b, c, w3_t[3], MD5C39, MD5S31);
619     MD5_STEP (MD5_I , c, d, a, b, w1_t[2], MD5C3a, MD5S32);
620     MD5_STEP (MD5_I , b, c, d, a, w3_t[1], MD5C3b, MD5S33);
621     MD5_STEP (MD5_I , a, b, c, d, w1_t[0], MD5C3c, MD5S30);
622     MD5_STEP (MD5_I , d, a, b, c, w2_t[3], MD5C3d, MD5S31);
623     MD5_STEP (MD5_I , c, d, a, b, w0_t[2], MD5C3e, MD5S32);
624     MD5_STEP (MD5_I , b, c, d, a, w2_t[1], MD5C3f, MD5S33);
625
626     const u32x r_a = a + MD5M_A;
627     const u32x r_b = b + MD5M_B;
628     const u32x r_c = c + MD5M_C;
629     const u32x r_d = d + MD5M_D;
630
631     a = r_a;
632     b = r_b;
633     c = r_c;
634     d = r_d;
635
636     MD5_STEP0(MD5_Fo, a, b, c, d,       MD5C00, MD5S00);
637     MD5_STEP0(MD5_Fo, d, a, b, c,       MD5C01, MD5S01);
638     MD5_STEP0(MD5_Fo, c, d, a, b,       MD5C02, MD5S02);
639     MD5_STEP0(MD5_Fo, b, c, d, a,       MD5C03, MD5S03);
640     MD5_STEP0(MD5_Fo, a, b, c, d,       MD5C04, MD5S00);
641     MD5_STEP0(MD5_Fo, d, a, b, c,       MD5C05, MD5S01);
642     MD5_STEP0(MD5_Fo, c, d, a, b,       MD5C06, MD5S02);
643     MD5_STEP0(MD5_Fo, b, c, d, a,       MD5C07, MD5S03);
644     MD5_STEP0(MD5_Fo, a, b, c, d,       MD5C08, MD5S00);
645     MD5_STEP0(MD5_Fo, d, a, b, c,       MD5C09, MD5S01);
646     MD5_STEP0(MD5_Fo, c, d, a, b,       MD5C0a, MD5S02);
647     MD5_STEP0(MD5_Fo, b, c, d, a,       MD5C0b, MD5S03);
648     MD5_STEP0(MD5_Fo, a, b, c, d,       MD5C0c, MD5S00);
649     MD5_STEP0(MD5_Fo, d, a, b, c,       MD5C0d, MD5S01);
650     MD5_STEP (MD5_Fo, c, d, a, b, r_14, MD5C0e, MD5S02);
651     MD5_STEP0(MD5_Fo, b, c, d, a,       MD5C0f, MD5S03);
652
653     MD5_STEP0(MD5_Go, a, b, c, d,       MD5C10, MD5S10);
654     MD5_STEP0(MD5_Go, d, a, b, c,       MD5C11, MD5S11);
655     MD5_STEP0(MD5_Go, c, d, a, b,       MD5C12, MD5S12);
656     MD5_STEP0(MD5_Go, b, c, d, a,       MD5C13, MD5S13);
657     MD5_STEP0(MD5_Go, a, b, c, d,       MD5C14, MD5S10);
658     MD5_STEP0(MD5_Go, d, a, b, c,       MD5C15, MD5S11);
659     MD5_STEP0(MD5_Go, c, d, a, b,       MD5C16, MD5S12);
660     MD5_STEP0(MD5_Go, b, c, d, a,       MD5C17, MD5S13);
661     MD5_STEP0(MD5_Go, a, b, c, d,       MD5C18, MD5S10);
662     MD5_STEP (MD5_Go, d, a, b, c, r_14, MD5C19, MD5S11);
663     MD5_STEP0(MD5_Go, c, d, a, b,       MD5C1a, MD5S12);
664     MD5_STEP0(MD5_Go, b, c, d, a,       MD5C1b, MD5S13);
665     MD5_STEP0(MD5_Go, a, b, c, d,       MD5C1c, MD5S10);
666     MD5_STEP0(MD5_Go, d, a, b, c,       MD5C1d, MD5S11);
667     MD5_STEP0(MD5_Go, c, d, a, b,       MD5C1e, MD5S12);
668     MD5_STEP0(MD5_Go, b, c, d, a,       MD5C1f, MD5S13);
669
670     MD5_STEP0(MD5_H , a, b, c, d,       MD5C20, MD5S20);
671     MD5_STEP0(MD5_H , d, a, b, c,       MD5C21, MD5S21);
672     MD5_STEP0(MD5_H , c, d, a, b,       MD5C22, MD5S22);
673     MD5_STEP (MD5_H , b, c, d, a, r_14, MD5C23, MD5S23);
674     MD5_STEP0(MD5_H , a, b, c, d,       MD5C24, MD5S20);
675     MD5_STEP0(MD5_H , d, a, b, c,       MD5C25, MD5S21);
676     MD5_STEP0(MD5_H , c, d, a, b,       MD5C26, MD5S22);
677     MD5_STEP0(MD5_H , b, c, d, a,       MD5C27, MD5S23);
678     MD5_STEP0(MD5_H , a, b, c, d,       MD5C28, MD5S20);
679     MD5_STEP0(MD5_H , d, a, b, c,       MD5C29, MD5S21);
680     MD5_STEP0(MD5_H , c, d, a, b,       MD5C2a, MD5S22);
681     MD5_STEP0(MD5_H , b, c, d, a,       MD5C2b, MD5S23);
682     MD5_STEP0(MD5_H , a, b, c, d,       MD5C2c, MD5S20);
683     MD5_STEP0(MD5_H , d, a, b, c,       MD5C2d, MD5S21);
684     MD5_STEP0(MD5_H , c, d, a, b,       MD5C2e, MD5S22);
685     MD5_STEP0(MD5_H , b, c, d, a,       MD5C2f, MD5S23);
686
687     MD5_STEP0(MD5_I , a, b, c, d,       MD5C30, MD5S30);
688     MD5_STEP0(MD5_I , d, a, b, c,       MD5C31, MD5S31);
689     MD5_STEP (MD5_I , c, d, a, b, r_14, MD5C32, MD5S32);
690     MD5_STEP0(MD5_I , b, c, d, a,       MD5C33, MD5S33);
691     MD5_STEP0(MD5_I , a, b, c, d,       MD5C34, MD5S30);
692     MD5_STEP0(MD5_I , d, a, b, c,       MD5C35, MD5S31);
693     MD5_STEP0(MD5_I , c, d, a, b,       MD5C36, MD5S32);
694     MD5_STEP0(MD5_I , b, c, d, a,       MD5C37, MD5S33);
695     MD5_STEP0(MD5_I , a, b, c, d,       MD5C38, MD5S30);
696     MD5_STEP0(MD5_I , d, a, b, c,       MD5C39, MD5S31);
697     MD5_STEP0(MD5_I , c, d, a, b,       MD5C3a, MD5S32);
698     MD5_STEP0(MD5_I , b, c, d, a,       MD5C3b, MD5S33);
699     MD5_STEP0(MD5_I , a, b, c, d,       MD5C3c, MD5S30);
700
701     if (MATCHES_NONE_VS ((a + r_a), search[0])) continue;
702
703     MD5_STEP0(MD5_I , d, a, b, c,       MD5C3d, MD5S31);
704     MD5_STEP0(MD5_I , c, d, a, b,       MD5C3e, MD5S32);
705     MD5_STEP0(MD5_I , b, c, d, a,       MD5C3f, MD5S33);
706
707     a += r_a;
708     b += r_b;
709     c += r_c;
710     d += r_d;
711
712     COMPARE_S_SIMD (a, d, c, b);
713   }
714 }
715
716 __kernel void m02710_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
717 {
718   /**
719    * base
720    */
721
722   const u32 gid = get_global_id (0);
723   const u32 lid = get_local_id (0);
724   const u32 lsz = get_local_size (0);
725
726   /**
727    * modifier
728    */
729
730   u32 w0[4];
731
732   w0[0] = pws[gid].i[ 0];
733   w0[1] = pws[gid].i[ 1];
734   w0[2] = pws[gid].i[ 2];
735   w0[3] = pws[gid].i[ 3];
736
737   u32 w1[4];
738
739   w1[0] = 0;
740   w1[1] = 0;
741   w1[2] = 0;
742   w1[3] = 0;
743
744   u32 w2[4];
745
746   w2[0] = 0;
747   w2[1] = 0;
748   w2[2] = 0;
749   w2[3] = 0;
750
751   u32 w3[4];
752
753   w3[0] = 0;
754   w3[1] = 0;
755   w3[2] = pws[gid].i[14];
756   w3[3] = 0;
757
758   const u32 pw_len = pws[gid].pw_len;
759
760   /**
761    * bin2asc table
762    */
763
764   __local u32 l_bin2asc[256];
765
766   for (u32 i = lid; i < 256; i += lsz)
767   {
768     const u32 i0 = (i >> 0) & 15;
769     const u32 i1 = (i >> 4) & 15;
770
771     l_bin2asc[i] = ((i0 < 10) ? '0' + i0 : 'a' - 10 + i0) << 8
772                  | ((i1 < 10) ? '0' + i1 : 'a' - 10 + i1) << 0;
773   }
774
775   barrier (CLK_LOCAL_MEM_FENCE);
776
777   if (gid >= gid_max) return;
778
779   /**
780    * main
781    */
782
783   m02710m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, l_bin2asc);
784 }
785
786 __kernel void m02710_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
787 {
788   /**
789    * base
790    */
791
792   const u32 gid = get_global_id (0);
793   const u32 lid = get_local_id (0);
794   const u32 lsz = get_local_size (0);
795
796   /**
797    * modifier
798    */
799
800   u32 w0[4];
801
802   w0[0] = pws[gid].i[ 0];
803   w0[1] = pws[gid].i[ 1];
804   w0[2] = pws[gid].i[ 2];
805   w0[3] = pws[gid].i[ 3];
806
807   u32 w1[4];
808
809   w1[0] = pws[gid].i[ 4];
810   w1[1] = pws[gid].i[ 5];
811   w1[2] = pws[gid].i[ 6];
812   w1[3] = pws[gid].i[ 7];
813
814   u32 w2[4];
815
816   w2[0] = 0;
817   w2[1] = 0;
818   w2[2] = 0;
819   w2[3] = 0;
820
821   u32 w3[4];
822
823   w3[0] = 0;
824   w3[1] = 0;
825   w3[2] = pws[gid].i[14];
826   w3[3] = 0;
827
828   const u32 pw_len = pws[gid].pw_len;
829
830   /**
831    * bin2asc table
832    */
833
834   __local u32 l_bin2asc[256];
835
836   for (u32 i = lid; i < 256; i += lsz)
837   {
838     const u32 i0 = (i >> 0) & 15;
839     const u32 i1 = (i >> 4) & 15;
840
841     l_bin2asc[i] = ((i0 < 10) ? '0' + i0 : 'a' - 10 + i0) << 8
842                  | ((i1 < 10) ? '0' + i1 : 'a' - 10 + i1) << 0;
843   }
844
845   barrier (CLK_LOCAL_MEM_FENCE);
846
847   if (gid >= gid_max) return;
848
849   /**
850    * main
851    */
852
853   m02710m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, l_bin2asc);
854 }
855
856 __kernel void m02710_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
857 {
858   /**
859    * base
860    */
861
862   const u32 gid = get_global_id (0);
863   const u32 lid = get_local_id (0);
864   const u32 lsz = get_local_size (0);
865
866   /**
867    * modifier
868    */
869
870   u32 w0[4];
871
872   w0[0] = pws[gid].i[ 0];
873   w0[1] = pws[gid].i[ 1];
874   w0[2] = pws[gid].i[ 2];
875   w0[3] = pws[gid].i[ 3];
876
877   u32 w1[4];
878
879   w1[0] = pws[gid].i[ 4];
880   w1[1] = pws[gid].i[ 5];
881   w1[2] = pws[gid].i[ 6];
882   w1[3] = pws[gid].i[ 7];
883
884   u32 w2[4];
885
886   w2[0] = pws[gid].i[ 8];
887   w2[1] = pws[gid].i[ 9];
888   w2[2] = pws[gid].i[10];
889   w2[3] = pws[gid].i[11];
890
891   u32 w3[4];
892
893   w3[0] = pws[gid].i[12];
894   w3[1] = pws[gid].i[13];
895   w3[2] = pws[gid].i[14];
896   w3[3] = pws[gid].i[15];
897
898   const u32 pw_len = pws[gid].pw_len;
899
900   /**
901    * bin2asc table
902    */
903
904   __local u32 l_bin2asc[256];
905
906   for (u32 i = lid; i < 256; i += lsz)
907   {
908     const u32 i0 = (i >> 0) & 15;
909     const u32 i1 = (i >> 4) & 15;
910
911     l_bin2asc[i] = ((i0 < 10) ? '0' + i0 : 'a' - 10 + i0) << 8
912                  | ((i1 < 10) ? '0' + i1 : 'a' - 10 + i1) << 0;
913   }
914
915   barrier (CLK_LOCAL_MEM_FENCE);
916
917   if (gid >= gid_max) return;
918
919   /**
920    * main
921    */
922
923   m02710m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, l_bin2asc);
924 }
925
926 __kernel void m02710_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
927 {
928   /**
929    * base
930    */
931
932   const u32 gid = get_global_id (0);
933   const u32 lid = get_local_id (0);
934   const u32 lsz = get_local_size (0);
935
936   /**
937    * modifier
938    */
939
940   u32 w0[4];
941
942   w0[0] = pws[gid].i[ 0];
943   w0[1] = pws[gid].i[ 1];
944   w0[2] = pws[gid].i[ 2];
945   w0[3] = pws[gid].i[ 3];
946
947   u32 w1[4];
948
949   w1[0] = 0;
950   w1[1] = 0;
951   w1[2] = 0;
952   w1[3] = 0;
953
954   u32 w2[4];
955
956   w2[0] = 0;
957   w2[1] = 0;
958   w2[2] = 0;
959   w2[3] = 0;
960
961   u32 w3[4];
962
963   w3[0] = 0;
964   w3[1] = 0;
965   w3[2] = pws[gid].i[14];
966   w3[3] = 0;
967
968   const u32 pw_len = pws[gid].pw_len;
969
970   /**
971    * bin2asc table
972    */
973
974   __local u32 l_bin2asc[256];
975
976   for (u32 i = lid; i < 256; i += lsz)
977   {
978     const u32 i0 = (i >> 0) & 15;
979     const u32 i1 = (i >> 4) & 15;
980
981     l_bin2asc[i] = ((i0 < 10) ? '0' + i0 : 'a' - 10 + i0) << 8
982                  | ((i1 < 10) ? '0' + i1 : 'a' - 10 + i1) << 0;
983   }
984
985   barrier (CLK_LOCAL_MEM_FENCE);
986
987   if (gid >= gid_max) return;
988
989   /**
990    * main
991    */
992
993   m02710s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, l_bin2asc);
994 }
995
996 __kernel void m02710_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
997 {
998   /**
999    * base
1000    */
1001
1002   const u32 gid = get_global_id (0);
1003   const u32 lid = get_local_id (0);
1004   const u32 lsz = get_local_size (0);
1005
1006   /**
1007    * modifier
1008    */
1009
1010   u32 w0[4];
1011
1012   w0[0] = pws[gid].i[ 0];
1013   w0[1] = pws[gid].i[ 1];
1014   w0[2] = pws[gid].i[ 2];
1015   w0[3] = pws[gid].i[ 3];
1016
1017   u32 w1[4];
1018
1019   w1[0] = pws[gid].i[ 4];
1020   w1[1] = pws[gid].i[ 5];
1021   w1[2] = pws[gid].i[ 6];
1022   w1[3] = pws[gid].i[ 7];
1023
1024   u32 w2[4];
1025
1026   w2[0] = 0;
1027   w2[1] = 0;
1028   w2[2] = 0;
1029   w2[3] = 0;
1030
1031   u32 w3[4];
1032
1033   w3[0] = 0;
1034   w3[1] = 0;
1035   w3[2] = pws[gid].i[14];
1036   w3[3] = 0;
1037
1038   const u32 pw_len = pws[gid].pw_len;
1039
1040   /**
1041    * bin2asc table
1042    */
1043
1044   __local u32 l_bin2asc[256];
1045
1046   for (u32 i = lid; i < 256; i += lsz)
1047   {
1048     const u32 i0 = (i >> 0) & 15;
1049     const u32 i1 = (i >> 4) & 15;
1050
1051     l_bin2asc[i] = ((i0 < 10) ? '0' + i0 : 'a' - 10 + i0) << 8
1052                  | ((i1 < 10) ? '0' + i1 : 'a' - 10 + i1) << 0;
1053   }
1054
1055   barrier (CLK_LOCAL_MEM_FENCE);
1056
1057   if (gid >= gid_max) return;
1058
1059   /**
1060    * main
1061    */
1062
1063   m02710s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, l_bin2asc);
1064 }
1065
1066 __kernel void m02710_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
1067 {
1068   /**
1069    * base
1070    */
1071
1072   const u32 gid = get_global_id (0);
1073   const u32 lid = get_local_id (0);
1074   const u32 lsz = get_local_size (0);
1075
1076   /**
1077    * modifier
1078    */
1079
1080   u32 w0[4];
1081
1082   w0[0] = pws[gid].i[ 0];
1083   w0[1] = pws[gid].i[ 1];
1084   w0[2] = pws[gid].i[ 2];
1085   w0[3] = pws[gid].i[ 3];
1086
1087   u32 w1[4];
1088
1089   w1[0] = pws[gid].i[ 4];
1090   w1[1] = pws[gid].i[ 5];
1091   w1[2] = pws[gid].i[ 6];
1092   w1[3] = pws[gid].i[ 7];
1093
1094   u32 w2[4];
1095
1096   w2[0] = pws[gid].i[ 8];
1097   w2[1] = pws[gid].i[ 9];
1098   w2[2] = pws[gid].i[10];
1099   w2[3] = pws[gid].i[11];
1100
1101   u32 w3[4];
1102
1103   w3[0] = pws[gid].i[12];
1104   w3[1] = pws[gid].i[13];
1105   w3[2] = pws[gid].i[14];
1106   w3[3] = pws[gid].i[15];
1107
1108   const u32 pw_len = pws[gid].pw_len;
1109
1110   /**
1111    * bin2asc table
1112    */
1113
1114   __local u32 l_bin2asc[256];
1115
1116   for (u32 i = lid; i < 256; i += lsz)
1117   {
1118     const u32 i0 = (i >> 0) & 15;
1119     const u32 i1 = (i >> 4) & 15;
1120
1121     l_bin2asc[i] = ((i0 < 10) ? '0' + i0 : 'a' - 10 + i0) << 8
1122                  | ((i1 < 10) ? '0' + i1 : 'a' - 10 + i1) << 0;
1123   }
1124
1125   barrier (CLK_LOCAL_MEM_FENCE);
1126
1127   if (gid >= gid_max) return;
1128
1129   /**
1130    * main
1131    */
1132
1133   m02710s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, esalt_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, l_bin2asc);
1134 }