914abf9b136650adbbeacfbef394481b5ff2e25a
[hashcat.git] / OpenCL / m09710_a0.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _OLDOFFICE01_
7
8 //too much register pressure
9 //#define NEW_SIMD_CODE
10
11 #include "include/constants.h"
12 #include "include/kernel_vendor.h"
13
14 #define DGST_R0 0
15 #define DGST_R1 1
16 #define DGST_R2 2
17 #define DGST_R3 3
18
19 #include "include/kernel_functions.c"
20 #include "OpenCL/types_ocl.c"
21 #include "OpenCL/common.c"
22 #include "include/rp_kernel.h"
23 #include "OpenCL/rp.c"
24 #include "OpenCL/simd.c"
25
26 typedef struct
27 {
28   u8 S[256];
29
30   u32 wtf_its_faster;
31
32 } RC4_KEY;
33
34 static void swap (__local RC4_KEY *rc4_key, const u8 i, const u8 j)
35 {
36   u8 tmp;
37
38   tmp           = rc4_key->S[i];
39   rc4_key->S[i] = rc4_key->S[j];
40   rc4_key->S[j] = tmp;
41 }
42
43 static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
44 {
45   u32 v = 0x03020100;
46   u32 a = 0x04040404;
47
48   __local u32 *ptr = (__local u32 *) rc4_key->S;
49
50   #pragma unroll
51   for (u32 i = 0; i < 64; i++)
52   {
53     *ptr++ = v; v += a;
54   }
55
56   u32 j = 0;
57
58   for (u32 i = 0; i < 16; i++)
59   {
60     u32 idx = i * 16;
61
62     u32 v;
63
64     v = data[0];
65
66     j += rc4_key->S[idx] + (v >>  0); swap (rc4_key, idx, j); idx++;
67     j += rc4_key->S[idx] + (v >>  8); swap (rc4_key, idx, j); idx++;
68     j += rc4_key->S[idx] + (v >> 16); swap (rc4_key, idx, j); idx++;
69     j += rc4_key->S[idx] + (v >> 24); swap (rc4_key, idx, j); idx++;
70
71     v = data[1];
72
73     j += rc4_key->S[idx] + (v >>  0); swap (rc4_key, idx, j); idx++;
74     j += rc4_key->S[idx] + (v >>  8); swap (rc4_key, idx, j); idx++;
75     j += rc4_key->S[idx] + (v >> 16); swap (rc4_key, idx, j); idx++;
76     j += rc4_key->S[idx] + (v >> 24); swap (rc4_key, idx, j); idx++;
77
78     v = data[2];
79
80     j += rc4_key->S[idx] + (v >>  0); swap (rc4_key, idx, j); idx++;
81     j += rc4_key->S[idx] + (v >>  8); swap (rc4_key, idx, j); idx++;
82     j += rc4_key->S[idx] + (v >> 16); swap (rc4_key, idx, j); idx++;
83     j += rc4_key->S[idx] + (v >> 24); swap (rc4_key, idx, j); idx++;
84
85     v = data[3];
86
87     j += rc4_key->S[idx] + (v >>  0); swap (rc4_key, idx, j); idx++;
88     j += rc4_key->S[idx] + (v >>  8); swap (rc4_key, idx, j); idx++;
89     j += rc4_key->S[idx] + (v >> 16); swap (rc4_key, idx, j); idx++;
90     j += rc4_key->S[idx] + (v >> 24); swap (rc4_key, idx, j); idx++;
91   }
92 }
93
94 static u8 rc4_next_16 (__local RC4_KEY *rc4_key, u8 i, u8 j, const u32 in[4], u32 out[4])
95 {
96   #pragma unroll
97   for (u32 k = 0; k < 4; k++)
98   {
99     u32 xor4 = 0;
100
101     u8 idx;
102
103     i += 1;
104     j += rc4_key->S[i];
105
106     swap (rc4_key, i, j);
107
108     idx = rc4_key->S[i] + rc4_key->S[j];
109
110     xor4 |= rc4_key->S[idx] <<  0;
111
112     i += 1;
113     j += rc4_key->S[i];
114
115     swap (rc4_key, i, j);
116
117     idx = rc4_key->S[i] + rc4_key->S[j];
118
119     xor4 |= rc4_key->S[idx] <<  8;
120
121     i += 1;
122     j += rc4_key->S[i];
123
124     swap (rc4_key, i, j);
125
126     idx = rc4_key->S[i] + rc4_key->S[j];
127
128     xor4 |= rc4_key->S[idx] << 16;
129
130     i += 1;
131     j += rc4_key->S[i];
132
133     swap (rc4_key, i, j);
134
135     idx = rc4_key->S[i] + rc4_key->S[j];
136
137     xor4 |= rc4_key->S[idx] << 24;
138
139     out[k] = in[k] ^ xor4;
140   }
141
142   return j;
143 }
144
145 static void md5_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
146 {
147   u32 a = digest[0];
148   u32 b = digest[1];
149   u32 c = digest[2];
150   u32 d = digest[3];
151
152   u32 w0_t = w0[0];
153   u32 w1_t = w0[1];
154   u32 w2_t = w0[2];
155   u32 w3_t = w0[3];
156   u32 w4_t = w1[0];
157   u32 w5_t = w1[1];
158   u32 w6_t = w1[2];
159   u32 w7_t = w1[3];
160   u32 w8_t = w2[0];
161   u32 w9_t = w2[1];
162   u32 wa_t = w2[2];
163   u32 wb_t = w2[3];
164   u32 wc_t = w3[0];
165   u32 wd_t = w3[1];
166   u32 we_t = w3[2];
167   u32 wf_t = w3[3];
168
169   MD5_STEP (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
170   MD5_STEP (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
171   MD5_STEP (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
172   MD5_STEP (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
173   MD5_STEP (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
174   MD5_STEP (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
175   MD5_STEP (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
176   MD5_STEP (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
177   MD5_STEP (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
178   MD5_STEP (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
179   MD5_STEP (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
180   MD5_STEP (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
181   MD5_STEP (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
182   MD5_STEP (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
183   MD5_STEP (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
184   MD5_STEP (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
185
186   MD5_STEP (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
187   MD5_STEP (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
188   MD5_STEP (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
189   MD5_STEP (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
190   MD5_STEP (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
191   MD5_STEP (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
192   MD5_STEP (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
193   MD5_STEP (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
194   MD5_STEP (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
195   MD5_STEP (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
196   MD5_STEP (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
197   MD5_STEP (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
198   MD5_STEP (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
199   MD5_STEP (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
200   MD5_STEP (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
201   MD5_STEP (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
202
203   MD5_STEP (MD5_H , a, b, c, d, w5_t, MD5C20, MD5S20);
204   MD5_STEP (MD5_H , d, a, b, c, w8_t, MD5C21, MD5S21);
205   MD5_STEP (MD5_H , c, d, a, b, wb_t, MD5C22, MD5S22);
206   MD5_STEP (MD5_H , b, c, d, a, we_t, MD5C23, MD5S23);
207   MD5_STEP (MD5_H , a, b, c, d, w1_t, MD5C24, MD5S20);
208   MD5_STEP (MD5_H , d, a, b, c, w4_t, MD5C25, MD5S21);
209   MD5_STEP (MD5_H , c, d, a, b, w7_t, MD5C26, MD5S22);
210   MD5_STEP (MD5_H , b, c, d, a, wa_t, MD5C27, MD5S23);
211   MD5_STEP (MD5_H , a, b, c, d, wd_t, MD5C28, MD5S20);
212   MD5_STEP (MD5_H , d, a, b, c, w0_t, MD5C29, MD5S21);
213   MD5_STEP (MD5_H , c, d, a, b, w3_t, MD5C2a, MD5S22);
214   MD5_STEP (MD5_H , b, c, d, a, w6_t, MD5C2b, MD5S23);
215   MD5_STEP (MD5_H , a, b, c, d, w9_t, MD5C2c, MD5S20);
216   MD5_STEP (MD5_H , d, a, b, c, wc_t, MD5C2d, MD5S21);
217   MD5_STEP (MD5_H , c, d, a, b, wf_t, MD5C2e, MD5S22);
218   MD5_STEP (MD5_H , b, c, d, a, w2_t, MD5C2f, MD5S23);
219
220   MD5_STEP (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
221   MD5_STEP (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
222   MD5_STEP (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
223   MD5_STEP (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
224   MD5_STEP (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
225   MD5_STEP (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
226   MD5_STEP (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
227   MD5_STEP (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
228   MD5_STEP (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
229   MD5_STEP (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
230   MD5_STEP (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
231   MD5_STEP (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
232   MD5_STEP (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
233   MD5_STEP (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
234   MD5_STEP (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
235   MD5_STEP (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
236
237   digest[0] += a;
238   digest[1] += b;
239   digest[2] += c;
240   digest[3] += d;
241 }
242
243 __kernel void m09710_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice01_t *oldoffice01_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
244 {
245   /**
246    * modifier
247    */
248
249   const u32 lid = get_local_id (0);
250
251   /**
252    * base
253    */
254
255   const u32 gid = get_global_id (0);
256
257   if (gid >= gid_max) return;
258
259   u32 pw_buf0[4];
260   u32 pw_buf1[4];
261
262   pw_buf0[0] = pws[gid].i[ 0];
263   pw_buf0[1] = pws[gid].i[ 1];
264   pw_buf0[2] = pws[gid].i[ 2];
265   pw_buf0[3] = pws[gid].i[ 3];
266   pw_buf1[0] = pws[gid].i[ 4];
267   pw_buf1[1] = pws[gid].i[ 5];
268   pw_buf1[2] = pws[gid].i[ 6];
269   pw_buf1[3] = pws[gid].i[ 7];
270
271   const u32 pw_len = pws[gid].pw_len;
272
273   /**
274    * shared
275    */
276
277   __local RC4_KEY rc4_keys[64];
278
279   __local RC4_KEY *rc4_key = &rc4_keys[lid];
280
281   /**
282    * esalt
283    */
284
285   const u32 version = oldoffice01_bufs[salt_pos].version;
286
287   u32 encryptedVerifier[4];
288
289   encryptedVerifier[0] = oldoffice01_bufs[salt_pos].encryptedVerifier[0];
290   encryptedVerifier[1] = oldoffice01_bufs[salt_pos].encryptedVerifier[1];
291   encryptedVerifier[2] = oldoffice01_bufs[salt_pos].encryptedVerifier[2];
292   encryptedVerifier[3] = oldoffice01_bufs[salt_pos].encryptedVerifier[3];
293
294   /**
295    * loop
296    */
297
298   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
299   {
300     u32x w0[4] = { 0 };
301     u32x w1[4] = { 0 };
302     u32x w2[4] = { 0 };
303     u32x w3[4] = { 0 };
304
305     apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
306
307     /**
308      * md5
309      */
310
311     w0[0]  = w0[0];
312     w0[1]  = w0[1] & 0xff;
313     w0[2]  = 0x8000;
314     w0[3]  = 0;
315     w1[0]  = 0;
316     w1[1]  = 0;
317     w1[2]  = 0;
318     w1[3]  = 0;
319     w2[0]  = 0;
320     w2[1]  = 0;
321     w2[2]  = 0;
322     w2[3]  = 0;
323     w3[0]  = 0;
324     w3[1]  = 0;
325     w3[2]  = 9 * 8;
326     w3[3]  = 0;
327
328     u32 digest[4];
329
330     digest[0] = MD5M_A;
331     digest[1] = MD5M_B;
332     digest[2] = MD5M_C;
333     digest[3] = MD5M_D;
334
335     md5_transform (w0, w1, w2, w3, digest);
336
337     // now the RC4 part
338
339     rc4_init_16 (rc4_key, digest);
340
341     u32 out[4];
342
343     u8 j = rc4_next_16 (rc4_key, 0, 0, encryptedVerifier, out);
344
345     w0[0] = out[0];
346     w0[1] = out[1];
347     w0[2] = out[2];
348     w0[3] = out[3];
349     w1[0] = 0x80;
350     w1[1] = 0;
351     w1[2] = 0;
352     w1[3] = 0;
353     w2[0] = 0;
354     w2[1] = 0;
355     w2[2] = 0;
356     w2[3] = 0;
357     w3[0] = 0;
358     w3[1] = 0;
359     w3[2] = 16 * 8;
360     w3[3] = 0;
361
362     digest[0] = MD5M_A;
363     digest[1] = MD5M_B;
364     digest[2] = MD5M_C;
365     digest[3] = MD5M_D;
366
367     md5_transform (w0, w1, w2, w3, digest);
368
369     rc4_next_16 (rc4_key, 16, j, digest, out);
370
371     COMPARE_M_SIMD (out[0], out[1], out[2], out[3]);
372   }
373 }
374
375 __kernel void m09710_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice01_t *oldoffice01_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
376 {
377 }
378
379 __kernel void m09710_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice01_t *oldoffice01_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
380 {
381 }
382
383 __kernel void m09710_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice01_t *oldoffice01_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
384 {
385   /**
386    * modifier
387    */
388
389   const u32 lid = get_local_id (0);
390
391   /**
392    * base
393    */
394
395   const u32 gid = get_global_id (0);
396
397   if (gid >= gid_max) return;
398
399   u32 pw_buf0[4];
400   u32 pw_buf1[4];
401
402   pw_buf0[0] = pws[gid].i[ 0];
403   pw_buf0[1] = pws[gid].i[ 1];
404   pw_buf0[2] = pws[gid].i[ 2];
405   pw_buf0[3] = pws[gid].i[ 3];
406   pw_buf1[0] = pws[gid].i[ 4];
407   pw_buf1[1] = pws[gid].i[ 5];
408   pw_buf1[2] = pws[gid].i[ 6];
409   pw_buf1[3] = pws[gid].i[ 7];
410
411   const u32 pw_len = pws[gid].pw_len;
412
413   /**
414    * shared
415    */
416
417   __local RC4_KEY rc4_keys[64];
418
419   __local RC4_KEY *rc4_key = &rc4_keys[lid];
420
421   /**
422    * esalt
423    */
424
425   const u32 version = oldoffice01_bufs[salt_pos].version;
426
427   u32 encryptedVerifier[4];
428
429   encryptedVerifier[0] = oldoffice01_bufs[salt_pos].encryptedVerifier[0];
430   encryptedVerifier[1] = oldoffice01_bufs[salt_pos].encryptedVerifier[1];
431   encryptedVerifier[2] = oldoffice01_bufs[salt_pos].encryptedVerifier[2];
432   encryptedVerifier[3] = oldoffice01_bufs[salt_pos].encryptedVerifier[3];
433
434   /**
435    * digest
436    */
437
438   const u32 search[4] =
439   {
440     digests_buf[digests_offset].digest_buf[DGST_R0],
441     digests_buf[digests_offset].digest_buf[DGST_R1],
442     digests_buf[digests_offset].digest_buf[DGST_R2],
443     digests_buf[digests_offset].digest_buf[DGST_R3]
444   };
445
446   /**
447    * loop
448    */
449
450   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
451   {
452     u32x w0[4] = { 0 };
453     u32x w1[4] = { 0 };
454     u32x w2[4] = { 0 };
455     u32x w3[4] = { 0 };
456
457     apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
458
459     /**
460      * md5
461      */
462
463     w0[0]  = w0[0];
464     w0[1]  = w0[1] & 0xff;
465     w0[2]  = 0x8000;
466     w0[3]  = 0;
467     w1[0]  = 0;
468     w1[1]  = 0;
469     w1[2]  = 0;
470     w1[3]  = 0;
471     w2[0]  = 0;
472     w2[1]  = 0;
473     w2[2]  = 0;
474     w2[3]  = 0;
475     w3[0]  = 0;
476     w3[1]  = 0;
477     w3[2]  = 9 * 8;
478     w3[3]  = 0;
479
480     u32 digest[4];
481
482     digest[0] = MD5M_A;
483     digest[1] = MD5M_B;
484     digest[2] = MD5M_C;
485     digest[3] = MD5M_D;
486
487     md5_transform (w0, w1, w2, w3, digest);
488
489     // now the RC4 part
490
491     rc4_init_16 (rc4_key, digest);
492
493     u32 out[4];
494
495     u8 j = rc4_next_16 (rc4_key, 0, 0, encryptedVerifier, out);
496
497     w0[0] = out[0];
498     w0[1] = out[1];
499     w0[2] = out[2];
500     w0[3] = out[3];
501     w1[0] = 0x80;
502     w1[1] = 0;
503     w1[2] = 0;
504     w1[3] = 0;
505     w2[0] = 0;
506     w2[1] = 0;
507     w2[2] = 0;
508     w2[3] = 0;
509     w3[0] = 0;
510     w3[1] = 0;
511     w3[2] = 16 * 8;
512     w3[3] = 0;
513
514     digest[0] = MD5M_A;
515     digest[1] = MD5M_B;
516     digest[2] = MD5M_C;
517     digest[3] = MD5M_D;
518
519     md5_transform (w0, w1, w2, w3, digest);
520
521     rc4_next_16 (rc4_key, 16, j, digest, out);
522
523     COMPARE_S_SIMD (out[0], out[1], out[2], out[3]);
524   }
525 }
526
527 __kernel void m09710_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice01_t *oldoffice01_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
528 {
529 }
530
531 __kernel void m09710_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice01_t *oldoffice01_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
532 {
533 }