9f90c54bc58fff77202435d8c0a136059a897c5f
[hashcat.git] / OpenCL / m02500.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _WPA_
7
8 #define NEW_SIMD_CODE
9
10 #include "inc_hash_constants.h"
11 #include "inc_vendor.cl"
12
13 #define DGST_R0 0
14 #define DGST_R1 1
15 #define DGST_R2 2
16 #define DGST_R3 3
17
18 #include "inc_hash_functions.cl"
19 #include "inc_types.cl"
20 #include "inc_common.cl"
21 #include "inc_simd.cl"
22
23 #define COMPARE_S "inc_comp_single.cl"
24 #define COMPARE_M "inc_comp_multi.cl"
25
26 void md5_transform_S (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
27 {
28   u32 a = digest[0];
29   u32 b = digest[1];
30   u32 c = digest[2];
31   u32 d = digest[3];
32
33   u32 w0_t = w0[0];
34   u32 w1_t = w0[1];
35   u32 w2_t = w0[2];
36   u32 w3_t = w0[3];
37   u32 w4_t = w1[0];
38   u32 w5_t = w1[1];
39   u32 w6_t = w1[2];
40   u32 w7_t = w1[3];
41   u32 w8_t = w2[0];
42   u32 w9_t = w2[1];
43   u32 wa_t = w2[2];
44   u32 wb_t = w2[3];
45   u32 wc_t = w3[0];
46   u32 wd_t = w3[1];
47   u32 we_t = w3[2];
48   u32 wf_t = w3[3];
49
50   MD5_STEP_S (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
51   MD5_STEP_S (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
52   MD5_STEP_S (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
53   MD5_STEP_S (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
54   MD5_STEP_S (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
55   MD5_STEP_S (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
56   MD5_STEP_S (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
57   MD5_STEP_S (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
58   MD5_STEP_S (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
59   MD5_STEP_S (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
60   MD5_STEP_S (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
61   MD5_STEP_S (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
62   MD5_STEP_S (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
63   MD5_STEP_S (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
64   MD5_STEP_S (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
65   MD5_STEP_S (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
66
67   MD5_STEP_S (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
68   MD5_STEP_S (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
69   MD5_STEP_S (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
70   MD5_STEP_S (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
71   MD5_STEP_S (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
72   MD5_STEP_S (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
73   MD5_STEP_S (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
74   MD5_STEP_S (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
75   MD5_STEP_S (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
76   MD5_STEP_S (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
77   MD5_STEP_S (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
78   MD5_STEP_S (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
79   MD5_STEP_S (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
80   MD5_STEP_S (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
81   MD5_STEP_S (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
82   MD5_STEP_S (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
83
84   MD5_STEP_S (MD5_H , a, b, c, d, w5_t, MD5C20, MD5S20);
85   MD5_STEP_S (MD5_H , d, a, b, c, w8_t, MD5C21, MD5S21);
86   MD5_STEP_S (MD5_H , c, d, a, b, wb_t, MD5C22, MD5S22);
87   MD5_STEP_S (MD5_H , b, c, d, a, we_t, MD5C23, MD5S23);
88   MD5_STEP_S (MD5_H , a, b, c, d, w1_t, MD5C24, MD5S20);
89   MD5_STEP_S (MD5_H , d, a, b, c, w4_t, MD5C25, MD5S21);
90   MD5_STEP_S (MD5_H , c, d, a, b, w7_t, MD5C26, MD5S22);
91   MD5_STEP_S (MD5_H , b, c, d, a, wa_t, MD5C27, MD5S23);
92   MD5_STEP_S (MD5_H , a, b, c, d, wd_t, MD5C28, MD5S20);
93   MD5_STEP_S (MD5_H , d, a, b, c, w0_t, MD5C29, MD5S21);
94   MD5_STEP_S (MD5_H , c, d, a, b, w3_t, MD5C2a, MD5S22);
95   MD5_STEP_S (MD5_H , b, c, d, a, w6_t, MD5C2b, MD5S23);
96   MD5_STEP_S (MD5_H , a, b, c, d, w9_t, MD5C2c, MD5S20);
97   MD5_STEP_S (MD5_H , d, a, b, c, wc_t, MD5C2d, MD5S21);
98   MD5_STEP_S (MD5_H , c, d, a, b, wf_t, MD5C2e, MD5S22);
99   MD5_STEP_S (MD5_H , b, c, d, a, w2_t, MD5C2f, MD5S23);
100
101   MD5_STEP_S (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
102   MD5_STEP_S (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
103   MD5_STEP_S (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
104   MD5_STEP_S (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
105   MD5_STEP_S (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
106   MD5_STEP_S (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
107   MD5_STEP_S (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
108   MD5_STEP_S (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
109   MD5_STEP_S (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
110   MD5_STEP_S (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
111   MD5_STEP_S (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
112   MD5_STEP_S (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
113   MD5_STEP_S (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
114   MD5_STEP_S (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
115   MD5_STEP_S (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
116   MD5_STEP_S (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
117
118   digest[0] += a;
119   digest[1] += b;
120   digest[2] += c;
121   digest[3] += d;
122 }
123
124 void hmac_md5_pad_S (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[4], u32 opad[4])
125 {
126   w0[0] = w0[0] ^ 0x36363636;
127   w0[1] = w0[1] ^ 0x36363636;
128   w0[2] = w0[2] ^ 0x36363636;
129   w0[3] = w0[3] ^ 0x36363636;
130   w1[0] = w1[0] ^ 0x36363636;
131   w1[1] = w1[1] ^ 0x36363636;
132   w1[2] = w1[2] ^ 0x36363636;
133   w1[3] = w1[3] ^ 0x36363636;
134   w2[0] = w2[0] ^ 0x36363636;
135   w2[1] = w2[1] ^ 0x36363636;
136   w2[2] = w2[2] ^ 0x36363636;
137   w2[3] = w2[3] ^ 0x36363636;
138   w3[0] = w3[0] ^ 0x36363636;
139   w3[1] = w3[1] ^ 0x36363636;
140   w3[2] = w3[2] ^ 0x36363636;
141   w3[3] = w3[3] ^ 0x36363636;
142
143   ipad[0] = MD5M_A;
144   ipad[1] = MD5M_B;
145   ipad[2] = MD5M_C;
146   ipad[3] = MD5M_D;
147
148   md5_transform_S (w0, w1, w2, w3, ipad);
149
150   w0[0] = w0[0] ^ 0x6a6a6a6a;
151   w0[1] = w0[1] ^ 0x6a6a6a6a;
152   w0[2] = w0[2] ^ 0x6a6a6a6a;
153   w0[3] = w0[3] ^ 0x6a6a6a6a;
154   w1[0] = w1[0] ^ 0x6a6a6a6a;
155   w1[1] = w1[1] ^ 0x6a6a6a6a;
156   w1[2] = w1[2] ^ 0x6a6a6a6a;
157   w1[3] = w1[3] ^ 0x6a6a6a6a;
158   w2[0] = w2[0] ^ 0x6a6a6a6a;
159   w2[1] = w2[1] ^ 0x6a6a6a6a;
160   w2[2] = w2[2] ^ 0x6a6a6a6a;
161   w2[3] = w2[3] ^ 0x6a6a6a6a;
162   w3[0] = w3[0] ^ 0x6a6a6a6a;
163   w3[1] = w3[1] ^ 0x6a6a6a6a;
164   w3[2] = w3[2] ^ 0x6a6a6a6a;
165   w3[3] = w3[3] ^ 0x6a6a6a6a;
166
167   opad[0] = MD5M_A;
168   opad[1] = MD5M_B;
169   opad[2] = MD5M_C;
170   opad[3] = MD5M_D;
171
172   md5_transform_S (w0, w1, w2, w3, opad);
173 }
174
175 void hmac_md5_run_S (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[4], u32 opad[4], u32 digest[4])
176 {
177   digest[0] = ipad[0];
178   digest[1] = ipad[1];
179   digest[2] = ipad[2];
180   digest[3] = ipad[3];
181
182   md5_transform_S (w0, w1, w2, w3, digest);
183
184   w0[0] = digest[0];
185   w0[1] = digest[1];
186   w0[2] = digest[2];
187   w0[3] = digest[3];
188   w1[0] = 0x80;
189   w1[1] = 0;
190   w1[2] = 0;
191   w1[3] = 0;
192   w2[0] = 0;
193   w2[1] = 0;
194   w2[2] = 0;
195   w2[3] = 0;
196   w3[0] = 0;
197   w3[1] = 0;
198   w3[2] = (64 + 16) * 8;
199   w3[3] = 0;
200
201   digest[0] = opad[0];
202   digest[1] = opad[1];
203   digest[2] = opad[2];
204   digest[3] = opad[3];
205
206   md5_transform_S (w0, w1, w2, w3, digest);
207 }
208
209 void sha1_transform_S (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[5])
210 {
211   u32 A = digest[0];
212   u32 B = digest[1];
213   u32 C = digest[2];
214   u32 D = digest[3];
215   u32 E = digest[4];
216
217   u32 w0_t = w0[0];
218   u32 w1_t = w0[1];
219   u32 w2_t = w0[2];
220   u32 w3_t = w0[3];
221   u32 w4_t = w1[0];
222   u32 w5_t = w1[1];
223   u32 w6_t = w1[2];
224   u32 w7_t = w1[3];
225   u32 w8_t = w2[0];
226   u32 w9_t = w2[1];
227   u32 wa_t = w2[2];
228   u32 wb_t = w2[3];
229   u32 wc_t = w3[0];
230   u32 wd_t = w3[1];
231   u32 we_t = w3[2];
232   u32 wf_t = w3[3];
233
234   #undef K
235   #define K SHA1C00
236
237   SHA1_STEP_S (SHA1_F0o, A, B, C, D, E, w0_t);
238   SHA1_STEP_S (SHA1_F0o, E, A, B, C, D, w1_t);
239   SHA1_STEP_S (SHA1_F0o, D, E, A, B, C, w2_t);
240   SHA1_STEP_S (SHA1_F0o, C, D, E, A, B, w3_t);
241   SHA1_STEP_S (SHA1_F0o, B, C, D, E, A, w4_t);
242   SHA1_STEP_S (SHA1_F0o, A, B, C, D, E, w5_t);
243   SHA1_STEP_S (SHA1_F0o, E, A, B, C, D, w6_t);
244   SHA1_STEP_S (SHA1_F0o, D, E, A, B, C, w7_t);
245   SHA1_STEP_S (SHA1_F0o, C, D, E, A, B, w8_t);
246   SHA1_STEP_S (SHA1_F0o, B, C, D, E, A, w9_t);
247   SHA1_STEP_S (SHA1_F0o, A, B, C, D, E, wa_t);
248   SHA1_STEP_S (SHA1_F0o, E, A, B, C, D, wb_t);
249   SHA1_STEP_S (SHA1_F0o, D, E, A, B, C, wc_t);
250   SHA1_STEP_S (SHA1_F0o, C, D, E, A, B, wd_t);
251   SHA1_STEP_S (SHA1_F0o, B, C, D, E, A, we_t);
252   SHA1_STEP_S (SHA1_F0o, A, B, C, D, E, wf_t);
253   w0_t = rotl32_S ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP_S (SHA1_F0o, E, A, B, C, D, w0_t);
254   w1_t = rotl32_S ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP_S (SHA1_F0o, D, E, A, B, C, w1_t);
255   w2_t = rotl32_S ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP_S (SHA1_F0o, C, D, E, A, B, w2_t);
256   w3_t = rotl32_S ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP_S (SHA1_F0o, B, C, D, E, A, w3_t);
257
258   #undef K
259   #define K SHA1C01
260
261   w4_t = rotl32_S ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP_S (SHA1_F1, A, B, C, D, E, w4_t);
262   w5_t = rotl32_S ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP_S (SHA1_F1, E, A, B, C, D, w5_t);
263   w6_t = rotl32_S ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP_S (SHA1_F1, D, E, A, B, C, w6_t);
264   w7_t = rotl32_S ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP_S (SHA1_F1, C, D, E, A, B, w7_t);
265   w8_t = rotl32_S ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP_S (SHA1_F1, B, C, D, E, A, w8_t);
266   w9_t = rotl32_S ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP_S (SHA1_F1, A, B, C, D, E, w9_t);
267   wa_t = rotl32_S ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP_S (SHA1_F1, E, A, B, C, D, wa_t);
268   wb_t = rotl32_S ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP_S (SHA1_F1, D, E, A, B, C, wb_t);
269   wc_t = rotl32_S ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP_S (SHA1_F1, C, D, E, A, B, wc_t);
270   wd_t = rotl32_S ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP_S (SHA1_F1, B, C, D, E, A, wd_t);
271   we_t = rotl32_S ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP_S (SHA1_F1, A, B, C, D, E, we_t);
272   wf_t = rotl32_S ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP_S (SHA1_F1, E, A, B, C, D, wf_t);
273   w0_t = rotl32_S ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP_S (SHA1_F1, D, E, A, B, C, w0_t);
274   w1_t = rotl32_S ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP_S (SHA1_F1, C, D, E, A, B, w1_t);
275   w2_t = rotl32_S ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP_S (SHA1_F1, B, C, D, E, A, w2_t);
276   w3_t = rotl32_S ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP_S (SHA1_F1, A, B, C, D, E, w3_t);
277   w4_t = rotl32_S ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP_S (SHA1_F1, E, A, B, C, D, w4_t);
278   w5_t = rotl32_S ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP_S (SHA1_F1, D, E, A, B, C, w5_t);
279   w6_t = rotl32_S ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP_S (SHA1_F1, C, D, E, A, B, w6_t);
280   w7_t = rotl32_S ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP_S (SHA1_F1, B, C, D, E, A, w7_t);
281
282   #undef K
283   #define K SHA1C02
284
285   w8_t = rotl32_S ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP_S (SHA1_F2o, A, B, C, D, E, w8_t);
286   w9_t = rotl32_S ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP_S (SHA1_F2o, E, A, B, C, D, w9_t);
287   wa_t = rotl32_S ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP_S (SHA1_F2o, D, E, A, B, C, wa_t);
288   wb_t = rotl32_S ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP_S (SHA1_F2o, C, D, E, A, B, wb_t);
289   wc_t = rotl32_S ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP_S (SHA1_F2o, B, C, D, E, A, wc_t);
290   wd_t = rotl32_S ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP_S (SHA1_F2o, A, B, C, D, E, wd_t);
291   we_t = rotl32_S ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP_S (SHA1_F2o, E, A, B, C, D, we_t);
292   wf_t = rotl32_S ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP_S (SHA1_F2o, D, E, A, B, C, wf_t);
293   w0_t = rotl32_S ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP_S (SHA1_F2o, C, D, E, A, B, w0_t);
294   w1_t = rotl32_S ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP_S (SHA1_F2o, B, C, D, E, A, w1_t);
295   w2_t = rotl32_S ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP_S (SHA1_F2o, A, B, C, D, E, w2_t);
296   w3_t = rotl32_S ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP_S (SHA1_F2o, E, A, B, C, D, w3_t);
297   w4_t = rotl32_S ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP_S (SHA1_F2o, D, E, A, B, C, w4_t);
298   w5_t = rotl32_S ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP_S (SHA1_F2o, C, D, E, A, B, w5_t);
299   w6_t = rotl32_S ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP_S (SHA1_F2o, B, C, D, E, A, w6_t);
300   w7_t = rotl32_S ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP_S (SHA1_F2o, A, B, C, D, E, w7_t);
301   w8_t = rotl32_S ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP_S (SHA1_F2o, E, A, B, C, D, w8_t);
302   w9_t = rotl32_S ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP_S (SHA1_F2o, D, E, A, B, C, w9_t);
303   wa_t = rotl32_S ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP_S (SHA1_F2o, C, D, E, A, B, wa_t);
304   wb_t = rotl32_S ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP_S (SHA1_F2o, B, C, D, E, A, wb_t);
305
306   #undef K
307   #define K SHA1C03
308
309   wc_t = rotl32_S ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP_S (SHA1_F1, A, B, C, D, E, wc_t);
310   wd_t = rotl32_S ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP_S (SHA1_F1, E, A, B, C, D, wd_t);
311   we_t = rotl32_S ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP_S (SHA1_F1, D, E, A, B, C, we_t);
312   wf_t = rotl32_S ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP_S (SHA1_F1, C, D, E, A, B, wf_t);
313   w0_t = rotl32_S ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP_S (SHA1_F1, B, C, D, E, A, w0_t);
314   w1_t = rotl32_S ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP_S (SHA1_F1, A, B, C, D, E, w1_t);
315   w2_t = rotl32_S ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP_S (SHA1_F1, E, A, B, C, D, w2_t);
316   w3_t = rotl32_S ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP_S (SHA1_F1, D, E, A, B, C, w3_t);
317   w4_t = rotl32_S ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP_S (SHA1_F1, C, D, E, A, B, w4_t);
318   w5_t = rotl32_S ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP_S (SHA1_F1, B, C, D, E, A, w5_t);
319   w6_t = rotl32_S ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP_S (SHA1_F1, A, B, C, D, E, w6_t);
320   w7_t = rotl32_S ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP_S (SHA1_F1, E, A, B, C, D, w7_t);
321   w8_t = rotl32_S ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP_S (SHA1_F1, D, E, A, B, C, w8_t);
322   w9_t = rotl32_S ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP_S (SHA1_F1, C, D, E, A, B, w9_t);
323   wa_t = rotl32_S ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP_S (SHA1_F1, B, C, D, E, A, wa_t);
324   wb_t = rotl32_S ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP_S (SHA1_F1, A, B, C, D, E, wb_t);
325   wc_t = rotl32_S ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP_S (SHA1_F1, E, A, B, C, D, wc_t);
326   wd_t = rotl32_S ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP_S (SHA1_F1, D, E, A, B, C, wd_t);
327   we_t = rotl32_S ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP_S (SHA1_F1, C, D, E, A, B, we_t);
328   wf_t = rotl32_S ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP_S (SHA1_F1, B, C, D, E, A, wf_t);
329
330   digest[0] += A;
331   digest[1] += B;
332   digest[2] += C;
333   digest[3] += D;
334   digest[4] += E;
335 }
336
337 void hmac_sha1_pad_S (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[5], u32 opad[5])
338 {
339   w0[0] = w0[0] ^ 0x36363636;
340   w0[1] = w0[1] ^ 0x36363636;
341   w0[2] = w0[2] ^ 0x36363636;
342   w0[3] = w0[3] ^ 0x36363636;
343   w1[0] = w1[0] ^ 0x36363636;
344   w1[1] = w1[1] ^ 0x36363636;
345   w1[2] = w1[2] ^ 0x36363636;
346   w1[3] = w1[3] ^ 0x36363636;
347   w2[0] = w2[0] ^ 0x36363636;
348   w2[1] = w2[1] ^ 0x36363636;
349   w2[2] = w2[2] ^ 0x36363636;
350   w2[3] = w2[3] ^ 0x36363636;
351   w3[0] = w3[0] ^ 0x36363636;
352   w3[1] = w3[1] ^ 0x36363636;
353   w3[2] = w3[2] ^ 0x36363636;
354   w3[3] = w3[3] ^ 0x36363636;
355
356   ipad[0] = SHA1M_A;
357   ipad[1] = SHA1M_B;
358   ipad[2] = SHA1M_C;
359   ipad[3] = SHA1M_D;
360   ipad[4] = SHA1M_E;
361
362   sha1_transform_S (w0, w1, w2, w3, ipad);
363
364   w0[0] = w0[0] ^ 0x6a6a6a6a;
365   w0[1] = w0[1] ^ 0x6a6a6a6a;
366   w0[2] = w0[2] ^ 0x6a6a6a6a;
367   w0[3] = w0[3] ^ 0x6a6a6a6a;
368   w1[0] = w1[0] ^ 0x6a6a6a6a;
369   w1[1] = w1[1] ^ 0x6a6a6a6a;
370   w1[2] = w1[2] ^ 0x6a6a6a6a;
371   w1[3] = w1[3] ^ 0x6a6a6a6a;
372   w2[0] = w2[0] ^ 0x6a6a6a6a;
373   w2[1] = w2[1] ^ 0x6a6a6a6a;
374   w2[2] = w2[2] ^ 0x6a6a6a6a;
375   w2[3] = w2[3] ^ 0x6a6a6a6a;
376   w3[0] = w3[0] ^ 0x6a6a6a6a;
377   w3[1] = w3[1] ^ 0x6a6a6a6a;
378   w3[2] = w3[2] ^ 0x6a6a6a6a;
379   w3[3] = w3[3] ^ 0x6a6a6a6a;
380
381   opad[0] = SHA1M_A;
382   opad[1] = SHA1M_B;
383   opad[2] = SHA1M_C;
384   opad[3] = SHA1M_D;
385   opad[4] = SHA1M_E;
386
387   sha1_transform_S (w0, w1, w2, w3, opad);
388 }
389
390 void hmac_sha1_run_S (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[5], u32 opad[5], u32 digest[5])
391 {
392   digest[0] = ipad[0];
393   digest[1] = ipad[1];
394   digest[2] = ipad[2];
395   digest[3] = ipad[3];
396   digest[4] = ipad[4];
397
398   sha1_transform_S (w0, w1, w2, w3, digest);
399
400   w0[0] = digest[0];
401   w0[1] = digest[1];
402   w0[2] = digest[2];
403   w0[3] = digest[3];
404   w1[0] = digest[4];
405   w1[1] = 0x80000000;
406   w1[2] = 0;
407   w1[3] = 0;
408   w2[0] = 0;
409   w2[1] = 0;
410   w2[2] = 0;
411   w2[3] = 0;
412   w3[0] = 0;
413   w3[1] = 0;
414   w3[2] = 0;
415   w3[3] = (64 + 20) * 8;
416
417   digest[0] = opad[0];
418   digest[1] = opad[1];
419   digest[2] = opad[2];
420   digest[3] = opad[3];
421   digest[4] = opad[4];
422
423   sha1_transform_S (w0, w1, w2, w3, digest);
424 }
425
426 void sha1_transform_V (const u32x w0[4], const u32x w1[4], const u32x w2[4], const u32x w3[4], u32x digest[5])
427 {
428   u32x A = digest[0];
429   u32x B = digest[1];
430   u32x C = digest[2];
431   u32x D = digest[3];
432   u32x E = digest[4];
433
434   u32x w0_t = w0[0];
435   u32x w1_t = w0[1];
436   u32x w2_t = w0[2];
437   u32x w3_t = w0[3];
438   u32x w4_t = w1[0];
439   u32x w5_t = w1[1];
440   u32x w6_t = w1[2];
441   u32x w7_t = w1[3];
442   u32x w8_t = w2[0];
443   u32x w9_t = w2[1];
444   u32x wa_t = w2[2];
445   u32x wb_t = w2[3];
446   u32x wc_t = w3[0];
447   u32x wd_t = w3[1];
448   u32x we_t = w3[2];
449   u32x wf_t = w3[3];
450
451   #undef K
452   #define K SHA1C00
453
454   SHA1_STEP (SHA1_F0o, A, B, C, D, E, w0_t);
455   SHA1_STEP (SHA1_F0o, E, A, B, C, D, w1_t);
456   SHA1_STEP (SHA1_F0o, D, E, A, B, C, w2_t);
457   SHA1_STEP (SHA1_F0o, C, D, E, A, B, w3_t);
458   SHA1_STEP (SHA1_F0o, B, C, D, E, A, w4_t);
459   SHA1_STEP (SHA1_F0o, A, B, C, D, E, w5_t);
460   SHA1_STEP (SHA1_F0o, E, A, B, C, D, w6_t);
461   SHA1_STEP (SHA1_F0o, D, E, A, B, C, w7_t);
462   SHA1_STEP (SHA1_F0o, C, D, E, A, B, w8_t);
463   SHA1_STEP (SHA1_F0o, B, C, D, E, A, w9_t);
464   SHA1_STEP (SHA1_F0o, A, B, C, D, E, wa_t);
465   SHA1_STEP (SHA1_F0o, E, A, B, C, D, wb_t);
466   SHA1_STEP (SHA1_F0o, D, E, A, B, C, wc_t);
467   SHA1_STEP (SHA1_F0o, C, D, E, A, B, wd_t);
468   SHA1_STEP (SHA1_F0o, B, C, D, E, A, we_t);
469   SHA1_STEP (SHA1_F0o, A, B, C, D, E, wf_t);
470   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F0o, E, A, B, C, D, w0_t);
471   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F0o, D, E, A, B, C, w1_t);
472   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F0o, C, D, E, A, B, w2_t);
473   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F0o, B, C, D, E, A, w3_t);
474
475   #undef K
476   #define K SHA1C01
477
478   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w4_t);
479   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w5_t);
480   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w6_t);
481   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w7_t);
482   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w8_t);
483   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w9_t);
484   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wa_t);
485   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, wb_t);
486   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, wc_t);
487   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wd_t);
488   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, we_t);
489   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wf_t);
490   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w0_t);
491   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w1_t);
492   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w2_t);
493   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w3_t);
494   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w4_t);
495   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w5_t);
496   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w6_t);
497   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w7_t);
498
499   #undef K
500   #define K SHA1C02
501
502   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w8_t);
503   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w9_t);
504   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, wa_t);
505   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, wb_t);
506   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, wc_t);
507   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, wd_t);
508   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, we_t);
509   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, wf_t);
510   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, w0_t);
511   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, w1_t);
512   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w2_t);
513   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w3_t);
514   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, w4_t);
515   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, w5_t);
516   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, w6_t);
517   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w7_t);
518   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w8_t);
519   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, w9_t);
520   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, wa_t);
521   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, wb_t);
522
523   #undef K
524   #define K SHA1C03
525
526   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, wc_t);
527   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wd_t);
528   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, we_t);
529   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, wf_t);
530   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w0_t);
531   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w1_t);
532   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w2_t);
533   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w3_t);
534   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w4_t);
535   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w5_t);
536   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w6_t);
537   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w7_t);
538   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w8_t);
539   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w9_t);
540   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wa_t);
541   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, wb_t);
542   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wc_t);
543   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, wd_t);
544   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, we_t);
545   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wf_t);
546
547   digest[0] += A;
548   digest[1] += B;
549   digest[2] += C;
550   digest[3] += D;
551   digest[4] += E;
552 }
553
554 void hmac_sha1_run_V (u32x w0[4], u32x w1[4], u32x w2[4], u32x w3[4], u32x ipad[5], u32x opad[5], u32x digest[5])
555 {
556   digest[0] = ipad[0];
557   digest[1] = ipad[1];
558   digest[2] = ipad[2];
559   digest[3] = ipad[3];
560   digest[4] = ipad[4];
561
562   sha1_transform_V (w0, w1, w2, w3, digest);
563
564   w0[0] = digest[0];
565   w0[1] = digest[1];
566   w0[2] = digest[2];
567   w0[3] = digest[3];
568   w1[0] = digest[4];
569   w1[1] = 0x80000000;
570   w1[2] = 0;
571   w1[3] = 0;
572   w2[0] = 0;
573   w2[1] = 0;
574   w2[2] = 0;
575   w2[3] = 0;
576   w3[0] = 0;
577   w3[1] = 0;
578   w3[2] = 0;
579   w3[3] = (64 + 20) * 8;
580
581   digest[0] = opad[0];
582   digest[1] = opad[1];
583   digest[2] = opad[2];
584   digest[3] = opad[3];
585   digest[4] = opad[4];
586
587   sha1_transform_V (w0, w1, w2, w3, digest);
588 }
589
590 __kernel void m02500_init (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global wpa_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global wpa_t *wpa_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
591 {
592   /**
593    * base
594    */
595
596   const u32 gid = get_global_id (0);
597
598   if (gid >= gid_max) return;
599
600   u32 w0[4];
601
602   w0[0] = pws[gid].i[ 0];
603   w0[1] = pws[gid].i[ 1];
604   w0[2] = pws[gid].i[ 2];
605   w0[3] = pws[gid].i[ 3];
606
607   u32 w1[4];
608
609   w1[0] = pws[gid].i[ 4];
610   w1[1] = pws[gid].i[ 5];
611   w1[2] = pws[gid].i[ 6];
612   w1[3] = pws[gid].i[ 7];
613
614   u32 w2[4];
615
616   w2[0] = pws[gid].i[ 8];
617   w2[1] = pws[gid].i[ 9];
618   w2[2] = pws[gid].i[10];
619   w2[3] = pws[gid].i[11];
620
621   u32 w3[4];
622
623   w3[0] = pws[gid].i[12];
624   w3[1] = pws[gid].i[13];
625   w3[2] = pws[gid].i[14];
626   w3[3] = pws[gid].i[15];
627
628   /**
629    * salt
630    */
631
632   u32 salt_len = salt_bufs[salt_pos].salt_len;
633
634   u32 salt_buf0[4];
635   u32 salt_buf1[4];
636
637   salt_buf0[0] = salt_bufs[salt_pos].salt_buf[0];
638   salt_buf0[1] = salt_bufs[salt_pos].salt_buf[1];
639   salt_buf0[2] = salt_bufs[salt_pos].salt_buf[2];
640   salt_buf0[3] = salt_bufs[salt_pos].salt_buf[3];
641   salt_buf1[0] = salt_bufs[salt_pos].salt_buf[4];
642   salt_buf1[1] = salt_bufs[salt_pos].salt_buf[5];
643   salt_buf1[2] = salt_bufs[salt_pos].salt_buf[6];
644   salt_buf1[3] = salt_bufs[salt_pos].salt_buf[7];
645
646   /**
647    * pads
648    */
649
650   w0[0] = swap32_S (w0[0]);
651   w0[1] = swap32_S (w0[1]);
652   w0[2] = swap32_S (w0[2]);
653   w0[3] = swap32_S (w0[3]);
654   w1[0] = swap32_S (w1[0]);
655   w1[1] = swap32_S (w1[1]);
656   w1[2] = swap32_S (w1[2]);
657   w1[3] = swap32_S (w1[3]);
658   w2[0] = swap32_S (w2[0]);
659   w2[1] = swap32_S (w2[1]);
660   w2[2] = swap32_S (w2[2]);
661   w2[3] = swap32_S (w2[3]);
662   w3[0] = swap32_S (w3[0]);
663   w3[1] = swap32_S (w3[1]);
664   w3[2] = swap32_S (w3[2]);
665   w3[3] = swap32_S (w3[3]);
666
667   u32 ipad[5];
668   u32 opad[5];
669
670   hmac_sha1_pad_S (w0, w1, w2, w3, ipad, opad);
671
672   tmps[gid].ipad[0] = ipad[0];
673   tmps[gid].ipad[1] = ipad[1];
674   tmps[gid].ipad[2] = ipad[2];
675   tmps[gid].ipad[3] = ipad[3];
676   tmps[gid].ipad[4] = ipad[4];
677
678   tmps[gid].opad[0] = opad[0];
679   tmps[gid].opad[1] = opad[1];
680   tmps[gid].opad[2] = opad[2];
681   tmps[gid].opad[3] = opad[3];
682   tmps[gid].opad[4] = opad[4];
683
684   for (u32 i = 0, j = 1; i < 8; i += 5, j += 1)
685   {
686     w0[0] = salt_buf0[0];
687     w0[1] = salt_buf0[1];
688     w0[2] = salt_buf0[2];
689     w0[3] = salt_buf0[3];
690     w1[0] = salt_buf1[0];
691     w1[1] = salt_buf1[1];
692     w1[2] = salt_buf1[2];
693     w1[3] = salt_buf1[3];
694     w2[0] = 0;
695     w2[1] = 0;
696     w2[2] = 0;
697     w2[3] = 0;
698     w3[0] = 0;
699     w3[1] = 0;
700     w3[2] = 0;
701     w3[3] = 0;
702
703     if (j == 1)
704       append_0x01_3x4_S (w0, w1, w2, salt_len + 3);
705     else
706       append_0x02_3x4_S (w0, w1, w2, salt_len + 3);
707
708     append_0x80_3x4_S (w0, w1, w2, salt_len + 4);
709
710     w0[0] = swap32_S (w0[0]);
711     w0[1] = swap32_S (w0[1]);
712     w0[2] = swap32_S (w0[2]);
713     w0[3] = swap32_S (w0[3]);
714     w1[0] = swap32_S (w1[0]);
715     w1[1] = swap32_S (w1[1]);
716     w1[2] = swap32_S (w1[2]);
717     w1[3] = swap32_S (w1[3]);
718     w2[0] = swap32_S (w2[0]);
719     w2[1] = swap32_S (w2[1]);
720     w2[2] = 0;
721     w2[3] = 0;
722     w3[0] = 0;
723     w3[1] = 0;
724     w3[2] = 0;
725     w3[3] = (64 + salt_len + 4) * 8;
726
727     u32 dgst[5];
728
729     hmac_sha1_run_S (w0, w1, w2, w3, ipad, opad, dgst);
730
731     tmps[gid].dgst[i + 0] = dgst[0];
732     tmps[gid].dgst[i + 1] = dgst[1];
733     tmps[gid].dgst[i + 2] = dgst[2];
734     tmps[gid].dgst[i + 3] = dgst[3];
735     tmps[gid].dgst[i + 4] = dgst[4];
736
737     tmps[gid].out[i + 0] = dgst[0];
738     tmps[gid].out[i + 1] = dgst[1];
739     tmps[gid].out[i + 2] = dgst[2];
740     tmps[gid].out[i + 3] = dgst[3];
741     tmps[gid].out[i + 4] = dgst[4];
742   }
743 }
744
745 __kernel void m02500_loop (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global wpa_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global wpa_t *wpa_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
746 {
747   const u32 gid = get_global_id (0);
748
749   if (gid >= gid_max) return;
750
751   u32x ipad[5];
752   u32x opad[5];
753
754   ipad[0] = packv (tmps, ipad, gid, 0);
755   ipad[1] = packv (tmps, ipad, gid, 1);
756   ipad[2] = packv (tmps, ipad, gid, 2);
757   ipad[3] = packv (tmps, ipad, gid, 3);
758   ipad[4] = packv (tmps, ipad, gid, 4);
759
760   opad[0] = packv (tmps, opad, gid, 0);
761   opad[1] = packv (tmps, opad, gid, 1);
762   opad[2] = packv (tmps, opad, gid, 2);
763   opad[3] = packv (tmps, opad, gid, 3);
764   opad[4] = packv (tmps, opad, gid, 4);
765
766   for (u32 i = 0; i < 8; i += 5)
767   {
768     u32x dgst[5];
769     u32x out[5];
770
771     dgst[0] = packv (tmps, dgst, gid, i + 0);
772     dgst[1] = packv (tmps, dgst, gid, i + 1);
773     dgst[2] = packv (tmps, dgst, gid, i + 2);
774     dgst[3] = packv (tmps, dgst, gid, i + 3);
775     dgst[4] = packv (tmps, dgst, gid, i + 4);
776
777     out[0] = packv (tmps, out, gid, i + 0);
778     out[1] = packv (tmps, out, gid, i + 1);
779     out[2] = packv (tmps, out, gid, i + 2);
780     out[3] = packv (tmps, out, gid, i + 3);
781     out[4] = packv (tmps, out, gid, i + 4);
782
783     for (u32 j = 0; j < loop_cnt; j++)
784     {
785       u32x w0[4];
786       u32x w1[4];
787       u32x w2[4];
788       u32x w3[4];
789
790       w0[0] = dgst[0];
791       w0[1] = dgst[1];
792       w0[2] = dgst[2];
793       w0[3] = dgst[3];
794       w1[0] = dgst[4];
795       w1[1] = 0x80000000;
796       w1[2] = 0;
797       w1[3] = 0;
798       w2[0] = 0;
799       w2[1] = 0;
800       w2[2] = 0;
801       w2[3] = 0;
802       w3[0] = 0;
803       w3[1] = 0;
804       w3[2] = 0;
805       w3[3] = (64 + 20) * 8;
806
807       hmac_sha1_run_V (w0, w1, w2, w3, ipad, opad, dgst);
808
809       out[0] ^= dgst[0];
810       out[1] ^= dgst[1];
811       out[2] ^= dgst[2];
812       out[3] ^= dgst[3];
813       out[4] ^= dgst[4];
814     }
815
816     unpackv (tmps, dgst, gid, i + 0, dgst[0]);
817     unpackv (tmps, dgst, gid, i + 1, dgst[1]);
818     unpackv (tmps, dgst, gid, i + 2, dgst[2]);
819     unpackv (tmps, dgst, gid, i + 3, dgst[3]);
820     unpackv (tmps, dgst, gid, i + 4, dgst[4]);
821
822     unpackv (tmps, out, gid, i + 0, out[0]);
823     unpackv (tmps, out, gid, i + 1, out[1]);
824     unpackv (tmps, out, gid, i + 2, out[2]);
825     unpackv (tmps, out, gid, i + 3, out[3]);
826     unpackv (tmps, out, gid, i + 4, out[4]);
827   }
828 }
829
830 __kernel void m02500_comp (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global wpa_tmp_t *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global wpa_t *wpa_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
831 {
832   const u32 gid = get_global_id (0);
833
834   if (gid >= gid_max) return;
835
836   const u32 lid = get_local_id (0);
837
838   u32 w0[4];
839   u32 w1[4];
840   u32 w2[4];
841   u32 w3[4];
842
843   w0[0] = tmps[gid].out[0];
844   w0[1] = tmps[gid].out[1];
845   w0[2] = tmps[gid].out[2];
846   w0[3] = tmps[gid].out[3];
847   w1[0] = tmps[gid].out[4];
848   w1[1] = tmps[gid].out[5];
849   w1[2] = tmps[gid].out[6];
850   w1[3] = tmps[gid].out[7];
851   w2[0] = 0;
852   w2[1] = 0;
853   w2[2] = 0;
854   w2[3] = 0;
855   w3[0] = 0;
856   w3[1] = 0;
857   w3[2] = 0;
858   w3[3] = 0;
859
860   u32 ipad[5];
861   u32 opad[5];
862
863   hmac_sha1_pad_S (w0, w1, w2, w3, ipad, opad);
864
865   w0[0] = wpa_bufs[salt_pos].pke[ 0];
866   w0[1] = wpa_bufs[salt_pos].pke[ 1];
867   w0[2] = wpa_bufs[salt_pos].pke[ 2];
868   w0[3] = wpa_bufs[salt_pos].pke[ 3];
869   w1[0] = wpa_bufs[salt_pos].pke[ 4];
870   w1[1] = wpa_bufs[salt_pos].pke[ 5];
871   w1[2] = wpa_bufs[salt_pos].pke[ 6];
872   w1[3] = wpa_bufs[salt_pos].pke[ 7];
873   w2[0] = wpa_bufs[salt_pos].pke[ 8];
874   w2[1] = wpa_bufs[salt_pos].pke[ 9];
875   w2[2] = wpa_bufs[salt_pos].pke[10];
876   w2[3] = wpa_bufs[salt_pos].pke[11];
877   w3[0] = wpa_bufs[salt_pos].pke[12];
878   w3[1] = wpa_bufs[salt_pos].pke[13];
879   w3[2] = wpa_bufs[salt_pos].pke[14];
880   w3[3] = wpa_bufs[salt_pos].pke[15];
881
882   sha1_transform_S (w0, w1, w2, w3, ipad);
883
884   w0[0] = wpa_bufs[salt_pos].pke[16];
885   w0[1] = wpa_bufs[salt_pos].pke[17];
886   w0[2] = wpa_bufs[salt_pos].pke[18];
887   w0[3] = wpa_bufs[salt_pos].pke[19];
888   w1[0] = wpa_bufs[salt_pos].pke[20];
889   w1[1] = wpa_bufs[salt_pos].pke[21];
890   w1[2] = wpa_bufs[salt_pos].pke[22];
891   w1[3] = wpa_bufs[salt_pos].pke[23];
892   w2[0] = wpa_bufs[salt_pos].pke[24];
893   w2[1] = 0x80000000;
894   w2[2] = 0;
895   w2[3] = 0;
896   w3[0] = 0;
897   w3[1] = 0;
898   w3[2] = 0;
899   w3[3] = (64 + 100) * 8;
900
901   u32 digest[5];
902
903   hmac_sha1_run_S (w0, w1, w2, w3, ipad, opad, digest);
904
905   {
906     w0[0] = swap32_S (digest[0]);
907     w0[1] = swap32_S (digest[1]);
908     w0[2] = swap32_S (digest[2]);
909     w0[3] = swap32_S (digest[3]);
910     w1[0] = 0;
911     w1[1] = 0;
912     w1[2] = 0;
913     w1[3] = 0;
914     w2[0] = 0;
915     w2[1] = 0;
916     w2[2] = 0;
917     w2[3] = 0;
918     w3[0] = 0;
919     w3[1] = 0;
920     w3[2] = 0;
921     w3[3] = 0;
922
923     hmac_md5_pad_S (w0, w1, w2, w3, ipad, opad);
924
925     int eapol_size = wpa_bufs[salt_pos].eapol_size;
926
927     int eapol_left;
928     int eapol_off;
929
930     for (eapol_left = eapol_size, eapol_off = 0; eapol_left >= 56; eapol_left -= 64, eapol_off += 16)
931     {
932       w0[0] = wpa_bufs[salt_pos].eapol[eapol_off +  0];
933       w0[1] = wpa_bufs[salt_pos].eapol[eapol_off +  1];
934       w0[2] = wpa_bufs[salt_pos].eapol[eapol_off +  2];
935       w0[3] = wpa_bufs[salt_pos].eapol[eapol_off +  3];
936       w1[0] = wpa_bufs[salt_pos].eapol[eapol_off +  4];
937       w1[1] = wpa_bufs[salt_pos].eapol[eapol_off +  5];
938       w1[2] = wpa_bufs[salt_pos].eapol[eapol_off +  6];
939       w1[3] = wpa_bufs[salt_pos].eapol[eapol_off +  7];
940       w2[0] = wpa_bufs[salt_pos].eapol[eapol_off +  8];
941       w2[1] = wpa_bufs[salt_pos].eapol[eapol_off +  9];
942       w2[2] = wpa_bufs[salt_pos].eapol[eapol_off + 10];
943       w2[3] = wpa_bufs[salt_pos].eapol[eapol_off + 11];
944       w3[0] = wpa_bufs[salt_pos].eapol[eapol_off + 12];
945       w3[1] = wpa_bufs[salt_pos].eapol[eapol_off + 13];
946       w3[2] = wpa_bufs[salt_pos].eapol[eapol_off + 14];
947       w3[3] = wpa_bufs[salt_pos].eapol[eapol_off + 15];
948
949       md5_transform_S (w0, w1, w2, w3, ipad);
950     }
951
952     w0[0] = wpa_bufs[salt_pos].eapol[eapol_off +  0];
953     w0[1] = wpa_bufs[salt_pos].eapol[eapol_off +  1];
954     w0[2] = wpa_bufs[salt_pos].eapol[eapol_off +  2];
955     w0[3] = wpa_bufs[salt_pos].eapol[eapol_off +  3];
956     w1[0] = wpa_bufs[salt_pos].eapol[eapol_off +  4];
957     w1[1] = wpa_bufs[salt_pos].eapol[eapol_off +  5];
958     w1[2] = wpa_bufs[salt_pos].eapol[eapol_off +  6];
959     w1[3] = wpa_bufs[salt_pos].eapol[eapol_off +  7];
960     w2[0] = wpa_bufs[salt_pos].eapol[eapol_off +  8];
961     w2[1] = wpa_bufs[salt_pos].eapol[eapol_off +  9];
962     w2[2] = wpa_bufs[salt_pos].eapol[eapol_off + 10];
963     w2[3] = wpa_bufs[salt_pos].eapol[eapol_off + 11];
964     w3[0] = wpa_bufs[salt_pos].eapol[eapol_off + 12];
965     w3[1] = wpa_bufs[salt_pos].eapol[eapol_off + 13];
966     w3[2] = (64 + eapol_size) * 8;
967     w3[3] = 0;
968
969     u32 digest1[4];
970
971     hmac_md5_run_S (w0, w1, w2, w3, ipad, opad, digest1);
972
973     /**
974      * base
975      */
976
977     #define il_pos 0
978
979     const u32 r0 = digest1[DGST_R0];
980     const u32 r1 = digest1[DGST_R1];
981     const u32 r2 = digest1[DGST_R2];
982     const u32 r3 = digest1[DGST_R3];
983
984     #include COMPARE_M
985   }
986
987   {
988     w0[0] = digest[0];
989     w0[1] = digest[1];
990     w0[2] = digest[2];
991     w0[3] = digest[3];
992     w1[0] = 0;
993     w1[1] = 0;
994     w1[2] = 0;
995     w1[3] = 0;
996     w2[0] = 0;
997     w2[1] = 0;
998     w2[2] = 0;
999     w2[3] = 0;
1000     w3[0] = 0;
1001     w3[1] = 0;
1002     w3[2] = 0;
1003     w3[3] = 0;
1004
1005     hmac_sha1_pad_S (w0, w1, w2, w3, ipad, opad);
1006
1007     int eapol_size = wpa_bufs[salt_pos].eapol_size;
1008
1009     int eapol_left;
1010     int eapol_off;
1011
1012     for (eapol_left = eapol_size, eapol_off = 0; eapol_left >= 56; eapol_left -= 64, eapol_off += 16)
1013     {
1014       w0[0] = wpa_bufs[salt_pos].eapol[eapol_off +  0];
1015       w0[1] = wpa_bufs[salt_pos].eapol[eapol_off +  1];
1016       w0[2] = wpa_bufs[salt_pos].eapol[eapol_off +  2];
1017       w0[3] = wpa_bufs[salt_pos].eapol[eapol_off +  3];
1018       w1[0] = wpa_bufs[salt_pos].eapol[eapol_off +  4];
1019       w1[1] = wpa_bufs[salt_pos].eapol[eapol_off +  5];
1020       w1[2] = wpa_bufs[salt_pos].eapol[eapol_off +  6];
1021       w1[3] = wpa_bufs[salt_pos].eapol[eapol_off +  7];
1022       w2[0] = wpa_bufs[salt_pos].eapol[eapol_off +  8];
1023       w2[1] = wpa_bufs[salt_pos].eapol[eapol_off +  9];
1024       w2[2] = wpa_bufs[salt_pos].eapol[eapol_off + 10];
1025       w2[3] = wpa_bufs[salt_pos].eapol[eapol_off + 11];
1026       w3[0] = wpa_bufs[salt_pos].eapol[eapol_off + 12];
1027       w3[1] = wpa_bufs[salt_pos].eapol[eapol_off + 13];
1028       w3[2] = wpa_bufs[salt_pos].eapol[eapol_off + 14];
1029       w3[3] = wpa_bufs[salt_pos].eapol[eapol_off + 15];
1030
1031       sha1_transform_S (w0, w1, w2, w3, ipad);
1032     }
1033
1034     w0[0] = wpa_bufs[salt_pos].eapol[eapol_off +  0];
1035     w0[1] = wpa_bufs[salt_pos].eapol[eapol_off +  1];
1036     w0[2] = wpa_bufs[salt_pos].eapol[eapol_off +  2];
1037     w0[3] = wpa_bufs[salt_pos].eapol[eapol_off +  3];
1038     w1[0] = wpa_bufs[salt_pos].eapol[eapol_off +  4];
1039     w1[1] = wpa_bufs[salt_pos].eapol[eapol_off +  5];
1040     w1[2] = wpa_bufs[salt_pos].eapol[eapol_off +  6];
1041     w1[3] = wpa_bufs[salt_pos].eapol[eapol_off +  7];
1042     w2[0] = wpa_bufs[salt_pos].eapol[eapol_off +  8];
1043     w2[1] = wpa_bufs[salt_pos].eapol[eapol_off +  9];
1044     w2[2] = wpa_bufs[salt_pos].eapol[eapol_off + 10];
1045     w2[3] = wpa_bufs[salt_pos].eapol[eapol_off + 11];
1046     w3[0] = wpa_bufs[salt_pos].eapol[eapol_off + 12];
1047     w3[1] = wpa_bufs[salt_pos].eapol[eapol_off + 13];
1048     w3[2] = 0;
1049     w3[3] = (64 + eapol_size) * 8;
1050
1051     u32 digest2[5];
1052
1053     hmac_sha1_run_S (w0, w1, w2, w3, ipad, opad, digest2);
1054
1055     /**
1056      * base
1057      */
1058
1059     #define il_pos 0
1060
1061     const u32 r0 = digest2[DGST_R0];
1062     const u32 r1 = digest2[DGST_R1];
1063     const u32 r2 = digest2[DGST_R2];
1064     const u32 r3 = digest2[DGST_R3];
1065
1066     #include COMPARE_M
1067   }
1068 }