Converted to new SIMD: -m 9820 -a 0
[hashcat.git] / OpenCL / m09820_a0.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _OLDOFFICE34_
7
8 #define NEW_SIMD_CODE
9
10 #include "include/constants.h"
11 #include "include/kernel_vendor.h"
12
13 #define DGST_R0 0
14 #define DGST_R1 1
15 #define DGST_R2 2
16 #define DGST_R3 3
17
18 #include "include/kernel_functions.c"
19 #include "OpenCL/types_ocl.c"
20 #include "OpenCL/common.c"
21 #include "include/rp_kernel.h"
22 #include "OpenCL/rp.c"
23 #include "OpenCL/simd.c"
24
25 static void sha1_transform (const u32x w0[4], const u32x w1[4], const u32x w2[4], const u32x w3[4], u32x digest[5])
26 {
27   u32x A = digest[0];
28   u32x B = digest[1];
29   u32x C = digest[2];
30   u32x D = digest[3];
31   u32x E = digest[4];
32
33   u32x w0_t = w0[0];
34   u32x w1_t = w0[1];
35   u32x w2_t = w0[2];
36   u32x w3_t = w0[3];
37   u32x w4_t = w1[0];
38   u32x w5_t = w1[1];
39   u32x w6_t = w1[2];
40   u32x w7_t = w1[3];
41   u32x w8_t = w2[0];
42   u32x w9_t = w2[1];
43   u32x wa_t = w2[2];
44   u32x wb_t = w2[3];
45   u32x wc_t = w3[0];
46   u32x wd_t = w3[1];
47   u32x we_t = w3[2];
48   u32x wf_t = w3[3];
49
50   #undef K
51   #define K SHA1C00
52
53   SHA1_STEP (SHA1_F0o, A, B, C, D, E, w0_t);
54   SHA1_STEP (SHA1_F0o, E, A, B, C, D, w1_t);
55   SHA1_STEP (SHA1_F0o, D, E, A, B, C, w2_t);
56   SHA1_STEP (SHA1_F0o, C, D, E, A, B, w3_t);
57   SHA1_STEP (SHA1_F0o, B, C, D, E, A, w4_t);
58   SHA1_STEP (SHA1_F0o, A, B, C, D, E, w5_t);
59   SHA1_STEP (SHA1_F0o, E, A, B, C, D, w6_t);
60   SHA1_STEP (SHA1_F0o, D, E, A, B, C, w7_t);
61   SHA1_STEP (SHA1_F0o, C, D, E, A, B, w8_t);
62   SHA1_STEP (SHA1_F0o, B, C, D, E, A, w9_t);
63   SHA1_STEP (SHA1_F0o, A, B, C, D, E, wa_t);
64   SHA1_STEP (SHA1_F0o, E, A, B, C, D, wb_t);
65   SHA1_STEP (SHA1_F0o, D, E, A, B, C, wc_t);
66   SHA1_STEP (SHA1_F0o, C, D, E, A, B, wd_t);
67   SHA1_STEP (SHA1_F0o, B, C, D, E, A, we_t);
68   SHA1_STEP (SHA1_F0o, A, B, C, D, E, wf_t);
69   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F0o, E, A, B, C, D, w0_t);
70   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F0o, D, E, A, B, C, w1_t);
71   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F0o, C, D, E, A, B, w2_t);
72   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F0o, B, C, D, E, A, w3_t);
73
74   #undef K
75   #define K SHA1C01
76
77   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w4_t);
78   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w5_t);
79   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w6_t);
80   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w7_t);
81   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w8_t);
82   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w9_t);
83   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wa_t);
84   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, wb_t);
85   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, wc_t);
86   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wd_t);
87   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, we_t);
88   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wf_t);
89   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w0_t);
90   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w1_t);
91   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w2_t);
92   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w3_t);
93   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w4_t);
94   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w5_t);
95   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w6_t);
96   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w7_t);
97
98   #undef K
99   #define K SHA1C02
100
101   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w8_t);
102   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w9_t);
103   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, wa_t);
104   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, wb_t);
105   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, wc_t);
106   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, wd_t);
107   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, we_t);
108   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, wf_t);
109   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, w0_t);
110   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, w1_t);
111   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w2_t);
112   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w3_t);
113   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, w4_t);
114   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, w5_t);
115   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, w6_t);
116   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w7_t);
117   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w8_t);
118   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, w9_t);
119   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, wa_t);
120   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, wb_t);
121
122   #undef K
123   #define K SHA1C03
124
125   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, wc_t);
126   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wd_t);
127   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, we_t);
128   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, wf_t);
129   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w0_t);
130   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w1_t);
131   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w2_t);
132   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w3_t);
133   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w4_t);
134   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w5_t);
135   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w6_t);
136   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w7_t);
137   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w8_t);
138   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w9_t);
139   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wa_t);
140   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, wb_t);
141   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wc_t);
142   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, wd_t);
143   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, we_t);
144   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wf_t);
145
146   digest[0] += A;
147   digest[1] += B;
148   digest[2] += C;
149   digest[3] += D;
150   digest[4] += E;
151 }
152
153 __kernel void m09820_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice34_t *oldoffice34_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
154 {
155   /**
156    * modifier
157    */
158
159   const u32 lid = get_local_id (0);
160
161   /**
162    * base
163    */
164
165   const u32 gid = get_global_id (0);
166
167   if (gid >= gid_max) return;
168
169   u32 pw_buf0[4];
170
171   pw_buf0[0] = pws[gid].i[ 0];
172   pw_buf0[1] = pws[gid].i[ 1];
173   pw_buf0[2] = pws[gid].i[ 2];
174   pw_buf0[3] = pws[gid].i[ 3];
175
176   u32 pw_buf1[4];
177
178   pw_buf1[0] = pws[gid].i[ 4];
179   pw_buf1[1] = pws[gid].i[ 5];
180   pw_buf1[2] = pws[gid].i[ 6];
181   pw_buf1[3] = pws[gid].i[ 7];
182
183   const u32 pw_len = pws[gid].pw_len;
184
185   /**
186    * salt
187    */
188
189   u32 salt_buf[4];
190
191   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
192   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
193   salt_buf[2] = salt_bufs[salt_pos].salt_buf[2];
194   salt_buf[3] = salt_bufs[salt_pos].salt_buf[3];
195
196   const u32 salt_len = 16;
197
198   const u32 pw_salt_len = pw_len + salt_len;
199
200   /**
201    * loop
202    */
203
204   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
205   {
206     u32x w0[4] = { 0 };
207     u32x w1[4] = { 0 };
208     u32x w2[4] = { 0 };
209     u32x w3[4] = { 0 };
210
211     const u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
212
213     const u32 pw_salt_len = (out_len * 2) + salt_len;
214
215     append_0x80_2x4 (w0, w1, out_len);
216
217     u32x w0_t[4];
218     u32x w1_t[4];
219     u32x w2_t[4];
220     u32x w3_t[4];
221
222     make_unicode (w0, w0_t, w1_t);
223     make_unicode (w1, w2_t, w3_t);
224
225     switch_buffer_by_offset_le (w0_t, w1_t, w2_t, w3_t, salt_len);
226
227     w0_t[0] = salt_buf[0];
228     w0_t[1] = salt_buf[1];
229     w0_t[2] = salt_buf[2];
230     w0_t[3] = salt_buf[3];
231     w1_t[0] = swap32 (w1_t[0]);
232     w1_t[1] = swap32 (w1_t[1]);
233     w1_t[2] = swap32 (w1_t[2]);
234     w1_t[3] = swap32 (w1_t[3]);
235     w2_t[0] = swap32 (w2_t[0]);
236     w2_t[1] = swap32 (w2_t[1]);
237     w2_t[2] = swap32 (w2_t[2]);
238     w2_t[3] = swap32 (w2_t[3]);
239     w3_t[0] = swap32 (w3_t[0]);
240     w3_t[1] = swap32 (w3_t[1]);
241     w3_t[2] = 0;
242     w3_t[3] = pw_salt_len * 8;
243
244     u32x digest[5];
245
246     digest[0] = SHA1M_A;
247     digest[1] = SHA1M_B;
248     digest[2] = SHA1M_C;
249     digest[3] = SHA1M_D;
250     digest[4] = SHA1M_E;
251
252     sha1_transform (w0_t, w1_t, w2_t, w3_t, digest);
253
254     w0_t[0] = digest[0];
255     w0_t[1] = digest[1];
256     w0_t[2] = digest[2];
257     w0_t[3] = digest[3];
258     w1_t[0] = digest[4];
259     w1_t[1] = 0;
260     w1_t[2] = 0x80000000;
261     w1_t[3] = 0;
262     w2_t[0] = 0;
263     w2_t[1] = 0;
264     w2_t[2] = 0;
265     w2_t[3] = 0;
266     w3_t[0] = 0;
267     w3_t[1] = 0;
268     w3_t[2] = 0;
269     w3_t[3] = (20 + 4) * 8;
270
271     digest[0] = SHA1M_A;
272     digest[1] = SHA1M_B;
273     digest[2] = SHA1M_C;
274     digest[3] = SHA1M_D;
275     digest[4] = SHA1M_E;
276
277     sha1_transform (w0_t, w1_t, w2_t, w3_t, digest);
278
279     u32x a = swap32 (digest[0]);
280     u32x b = swap32 (digest[1]) & 0xff;
281     u32x c = 0;
282     u32x d = 0;
283
284     COMPARE_M_SIMD (a, b, c, d);
285   }
286 }
287
288 __kernel void m09820_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice34_t *oldoffice34_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
289 {
290 }
291
292 __kernel void m09820_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice34_t *oldoffice34_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
293 {
294 }
295
296 __kernel void m09820_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice34_t *oldoffice34_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
297 {
298   /**
299    * modifier
300    */
301
302   const u32 lid = get_local_id (0);
303
304   /**
305    * base
306    */
307
308   const u32 gid = get_global_id (0);
309
310   if (gid >= gid_max) return;
311
312   u32 pw_buf0[4];
313
314   pw_buf0[0] = pws[gid].i[ 0];
315   pw_buf0[1] = pws[gid].i[ 1];
316   pw_buf0[2] = pws[gid].i[ 2];
317   pw_buf0[3] = pws[gid].i[ 3];
318
319   u32 pw_buf1[4];
320
321   pw_buf1[0] = pws[gid].i[ 4];
322   pw_buf1[1] = pws[gid].i[ 5];
323   pw_buf1[2] = pws[gid].i[ 6];
324   pw_buf1[3] = pws[gid].i[ 7];
325
326   const u32 pw_len = pws[gid].pw_len;
327
328   /**
329    * digest
330    */
331
332   const u32 search[4] =
333   {
334     digests_buf[digests_offset].digest_buf[DGST_R0],
335     digests_buf[digests_offset].digest_buf[DGST_R1],
336     digests_buf[digests_offset].digest_buf[DGST_R2],
337     digests_buf[digests_offset].digest_buf[DGST_R3]
338   };
339
340   /**
341    * salt
342    */
343
344   u32 salt_buf[4];
345
346   salt_buf[0] = salt_bufs[salt_pos].salt_buf[0];
347   salt_buf[1] = salt_bufs[salt_pos].salt_buf[1];
348   salt_buf[2] = salt_bufs[salt_pos].salt_buf[2];
349   salt_buf[3] = salt_bufs[salt_pos].salt_buf[3];
350
351   const u32 salt_len = 16;
352
353   const u32 pw_salt_len = pw_len + salt_len;
354
355   /**
356    * loop
357    */
358
359   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
360   {
361     u32x w0[4] = { 0 };
362     u32x w1[4] = { 0 };
363     u32x w2[4] = { 0 };
364     u32x w3[4] = { 0 };
365
366     const u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
367
368     const u32 pw_salt_len = (out_len * 2) + salt_len;
369
370     append_0x80_2x4 (w0, w1, out_len);
371
372     u32x w0_t[4];
373     u32x w1_t[4];
374     u32x w2_t[4];
375     u32x w3_t[4];
376
377     make_unicode (w0, w0_t, w1_t);
378     make_unicode (w1, w2_t, w3_t);
379
380     switch_buffer_by_offset_le (w0_t, w1_t, w2_t, w3_t, salt_len);
381
382     w0_t[0] = salt_buf[0];
383     w0_t[1] = salt_buf[1];
384     w0_t[2] = salt_buf[2];
385     w0_t[3] = salt_buf[3];
386     w1_t[0] = swap32 (w1_t[0]);
387     w1_t[1] = swap32 (w1_t[1]);
388     w1_t[2] = swap32 (w1_t[2]);
389     w1_t[3] = swap32 (w1_t[3]);
390     w2_t[0] = swap32 (w2_t[0]);
391     w2_t[1] = swap32 (w2_t[1]);
392     w2_t[2] = swap32 (w2_t[2]);
393     w2_t[3] = swap32 (w2_t[3]);
394     w3_t[0] = swap32 (w3_t[0]);
395     w3_t[1] = swap32 (w3_t[1]);
396     w3_t[2] = 0;
397     w3_t[3] = pw_salt_len * 8;
398
399     u32x digest[5];
400
401     digest[0] = SHA1M_A;
402     digest[1] = SHA1M_B;
403     digest[2] = SHA1M_C;
404     digest[3] = SHA1M_D;
405     digest[4] = SHA1M_E;
406
407     sha1_transform (w0_t, w1_t, w2_t, w3_t, digest);
408
409     w0_t[0] = digest[0];
410     w0_t[1] = digest[1];
411     w0_t[2] = digest[2];
412     w0_t[3] = digest[3];
413     w1_t[0] = digest[4];
414     w1_t[1] = 0;
415     w1_t[2] = 0x80000000;
416     w1_t[3] = 0;
417     w2_t[0] = 0;
418     w2_t[1] = 0;
419     w2_t[2] = 0;
420     w2_t[3] = 0;
421     w3_t[0] = 0;
422     w3_t[1] = 0;
423     w3_t[2] = 0;
424     w3_t[3] = (20 + 4) * 8;
425
426     digest[0] = SHA1M_A;
427     digest[1] = SHA1M_B;
428     digest[2] = SHA1M_C;
429     digest[3] = SHA1M_D;
430     digest[4] = SHA1M_E;
431
432     sha1_transform (w0_t, w1_t, w2_t, w3_t, digest);
433
434     u32x a = swap32 (digest[0]);
435     u32x b = swap32 (digest[1]) & 0xff;
436     u32x c = 0;
437     u32x d = 0;
438
439     COMPARE_S_SIMD (a, b, c, d);
440   }
441 }
442
443 __kernel void m09820_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice34_t *oldoffice34_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
444 {
445 }
446
447 __kernel void m09820_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global oldoffice34_t *oldoffice34_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
448 {
449 }