Merge branch 'master' of https://github.com/hashcat/oclHashcat
[hashcat.git] / OpenCL / m05600_a1.cl
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _NETNTLMV2_
7
8 #include "include/constants.h"
9 #include "include/kernel_vendor.h"
10
11 #define DGST_R0 0
12 #define DGST_R1 3
13 #define DGST_R2 2
14 #define DGST_R3 1
15
16 #include "include/kernel_functions.c"
17 #include "OpenCL/types_ocl.c"
18 #include "OpenCL/common.c"
19
20 #define COMPARE_S "OpenCL/check_single_comp4.c"
21 #define COMPARE_M "OpenCL/check_multi_comp4.c"
22
23 static void md4_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
24 {
25   u32 a = digest[0];
26   u32 b = digest[1];
27   u32 c = digest[2];
28   u32 d = digest[3];
29
30   u32 w0_t = w0[0];
31   u32 w1_t = w0[1];
32   u32 w2_t = w0[2];
33   u32 w3_t = w0[3];
34   u32 w4_t = w1[0];
35   u32 w5_t = w1[1];
36   u32 w6_t = w1[2];
37   u32 w7_t = w1[3];
38   u32 w8_t = w2[0];
39   u32 w9_t = w2[1];
40   u32 wa_t = w2[2];
41   u32 wb_t = w2[3];
42   u32 wc_t = w3[0];
43   u32 wd_t = w3[1];
44   u32 we_t = w3[2];
45   u32 wf_t = w3[3];
46
47   MD4_STEP (MD4_Fo, a, b, c, d, w0_t, MD4C00, MD4S00);
48   MD4_STEP (MD4_Fo, d, a, b, c, w1_t, MD4C00, MD4S01);
49   MD4_STEP (MD4_Fo, c, d, a, b, w2_t, MD4C00, MD4S02);
50   MD4_STEP (MD4_Fo, b, c, d, a, w3_t, MD4C00, MD4S03);
51   MD4_STEP (MD4_Fo, a, b, c, d, w4_t, MD4C00, MD4S00);
52   MD4_STEP (MD4_Fo, d, a, b, c, w5_t, MD4C00, MD4S01);
53   MD4_STEP (MD4_Fo, c, d, a, b, w6_t, MD4C00, MD4S02);
54   MD4_STEP (MD4_Fo, b, c, d, a, w7_t, MD4C00, MD4S03);
55   MD4_STEP (MD4_Fo, a, b, c, d, w8_t, MD4C00, MD4S00);
56   MD4_STEP (MD4_Fo, d, a, b, c, w9_t, MD4C00, MD4S01);
57   MD4_STEP (MD4_Fo, c, d, a, b, wa_t, MD4C00, MD4S02);
58   MD4_STEP (MD4_Fo, b, c, d, a, wb_t, MD4C00, MD4S03);
59   MD4_STEP (MD4_Fo, a, b, c, d, wc_t, MD4C00, MD4S00);
60   MD4_STEP (MD4_Fo, d, a, b, c, wd_t, MD4C00, MD4S01);
61   MD4_STEP (MD4_Fo, c, d, a, b, we_t, MD4C00, MD4S02);
62   MD4_STEP (MD4_Fo, b, c, d, a, wf_t, MD4C00, MD4S03);
63
64   MD4_STEP (MD4_Go, a, b, c, d, w0_t, MD4C01, MD4S10);
65   MD4_STEP (MD4_Go, d, a, b, c, w4_t, MD4C01, MD4S11);
66   MD4_STEP (MD4_Go, c, d, a, b, w8_t, MD4C01, MD4S12);
67   MD4_STEP (MD4_Go, b, c, d, a, wc_t, MD4C01, MD4S13);
68   MD4_STEP (MD4_Go, a, b, c, d, w1_t, MD4C01, MD4S10);
69   MD4_STEP (MD4_Go, d, a, b, c, w5_t, MD4C01, MD4S11);
70   MD4_STEP (MD4_Go, c, d, a, b, w9_t, MD4C01, MD4S12);
71   MD4_STEP (MD4_Go, b, c, d, a, wd_t, MD4C01, MD4S13);
72   MD4_STEP (MD4_Go, a, b, c, d, w2_t, MD4C01, MD4S10);
73   MD4_STEP (MD4_Go, d, a, b, c, w6_t, MD4C01, MD4S11);
74   MD4_STEP (MD4_Go, c, d, a, b, wa_t, MD4C01, MD4S12);
75   MD4_STEP (MD4_Go, b, c, d, a, we_t, MD4C01, MD4S13);
76   MD4_STEP (MD4_Go, a, b, c, d, w3_t, MD4C01, MD4S10);
77   MD4_STEP (MD4_Go, d, a, b, c, w7_t, MD4C01, MD4S11);
78   MD4_STEP (MD4_Go, c, d, a, b, wb_t, MD4C01, MD4S12);
79   MD4_STEP (MD4_Go, b, c, d, a, wf_t, MD4C01, MD4S13);
80
81   MD4_STEP (MD4_H , a, b, c, d, w0_t, MD4C02, MD4S20);
82   MD4_STEP (MD4_H , d, a, b, c, w8_t, MD4C02, MD4S21);
83   MD4_STEP (MD4_H , c, d, a, b, w4_t, MD4C02, MD4S22);
84   MD4_STEP (MD4_H , b, c, d, a, wc_t, MD4C02, MD4S23);
85   MD4_STEP (MD4_H , a, b, c, d, w2_t, MD4C02, MD4S20);
86   MD4_STEP (MD4_H , d, a, b, c, wa_t, MD4C02, MD4S21);
87   MD4_STEP (MD4_H , c, d, a, b, w6_t, MD4C02, MD4S22);
88   MD4_STEP (MD4_H , b, c, d, a, we_t, MD4C02, MD4S23);
89   MD4_STEP (MD4_H , a, b, c, d, w1_t, MD4C02, MD4S20);
90   MD4_STEP (MD4_H , d, a, b, c, w9_t, MD4C02, MD4S21);
91   MD4_STEP (MD4_H , c, d, a, b, w5_t, MD4C02, MD4S22);
92   MD4_STEP (MD4_H , b, c, d, a, wd_t, MD4C02, MD4S23);
93   MD4_STEP (MD4_H , a, b, c, d, w3_t, MD4C02, MD4S20);
94   MD4_STEP (MD4_H , d, a, b, c, wb_t, MD4C02, MD4S21);
95   MD4_STEP (MD4_H , c, d, a, b, w7_t, MD4C02, MD4S22);
96   MD4_STEP (MD4_H , b, c, d, a, wf_t, MD4C02, MD4S23);
97
98   digest[0] += a;
99   digest[1] += b;
100   digest[2] += c;
101   digest[3] += d;
102 }
103
104 static void md5_transform (const u32 w0[4], const u32 w1[4], const u32 w2[4], const u32 w3[4], u32 digest[4])
105 {
106   u32 a = digest[0];
107   u32 b = digest[1];
108   u32 c = digest[2];
109   u32 d = digest[3];
110
111   u32 w0_t = w0[0];
112   u32 w1_t = w0[1];
113   u32 w2_t = w0[2];
114   u32 w3_t = w0[3];
115   u32 w4_t = w1[0];
116   u32 w5_t = w1[1];
117   u32 w6_t = w1[2];
118   u32 w7_t = w1[3];
119   u32 w8_t = w2[0];
120   u32 w9_t = w2[1];
121   u32 wa_t = w2[2];
122   u32 wb_t = w2[3];
123   u32 wc_t = w3[0];
124   u32 wd_t = w3[1];
125   u32 we_t = w3[2];
126   u32 wf_t = w3[3];
127
128   MD5_STEP (MD5_Fo, a, b, c, d, w0_t, MD5C00, MD5S00);
129   MD5_STEP (MD5_Fo, d, a, b, c, w1_t, MD5C01, MD5S01);
130   MD5_STEP (MD5_Fo, c, d, a, b, w2_t, MD5C02, MD5S02);
131   MD5_STEP (MD5_Fo, b, c, d, a, w3_t, MD5C03, MD5S03);
132   MD5_STEP (MD5_Fo, a, b, c, d, w4_t, MD5C04, MD5S00);
133   MD5_STEP (MD5_Fo, d, a, b, c, w5_t, MD5C05, MD5S01);
134   MD5_STEP (MD5_Fo, c, d, a, b, w6_t, MD5C06, MD5S02);
135   MD5_STEP (MD5_Fo, b, c, d, a, w7_t, MD5C07, MD5S03);
136   MD5_STEP (MD5_Fo, a, b, c, d, w8_t, MD5C08, MD5S00);
137   MD5_STEP (MD5_Fo, d, a, b, c, w9_t, MD5C09, MD5S01);
138   MD5_STEP (MD5_Fo, c, d, a, b, wa_t, MD5C0a, MD5S02);
139   MD5_STEP (MD5_Fo, b, c, d, a, wb_t, MD5C0b, MD5S03);
140   MD5_STEP (MD5_Fo, a, b, c, d, wc_t, MD5C0c, MD5S00);
141   MD5_STEP (MD5_Fo, d, a, b, c, wd_t, MD5C0d, MD5S01);
142   MD5_STEP (MD5_Fo, c, d, a, b, we_t, MD5C0e, MD5S02);
143   MD5_STEP (MD5_Fo, b, c, d, a, wf_t, MD5C0f, MD5S03);
144
145   MD5_STEP (MD5_Go, a, b, c, d, w1_t, MD5C10, MD5S10);
146   MD5_STEP (MD5_Go, d, a, b, c, w6_t, MD5C11, MD5S11);
147   MD5_STEP (MD5_Go, c, d, a, b, wb_t, MD5C12, MD5S12);
148   MD5_STEP (MD5_Go, b, c, d, a, w0_t, MD5C13, MD5S13);
149   MD5_STEP (MD5_Go, a, b, c, d, w5_t, MD5C14, MD5S10);
150   MD5_STEP (MD5_Go, d, a, b, c, wa_t, MD5C15, MD5S11);
151   MD5_STEP (MD5_Go, c, d, a, b, wf_t, MD5C16, MD5S12);
152   MD5_STEP (MD5_Go, b, c, d, a, w4_t, MD5C17, MD5S13);
153   MD5_STEP (MD5_Go, a, b, c, d, w9_t, MD5C18, MD5S10);
154   MD5_STEP (MD5_Go, d, a, b, c, we_t, MD5C19, MD5S11);
155   MD5_STEP (MD5_Go, c, d, a, b, w3_t, MD5C1a, MD5S12);
156   MD5_STEP (MD5_Go, b, c, d, a, w8_t, MD5C1b, MD5S13);
157   MD5_STEP (MD5_Go, a, b, c, d, wd_t, MD5C1c, MD5S10);
158   MD5_STEP (MD5_Go, d, a, b, c, w2_t, MD5C1d, MD5S11);
159   MD5_STEP (MD5_Go, c, d, a, b, w7_t, MD5C1e, MD5S12);
160   MD5_STEP (MD5_Go, b, c, d, a, wc_t, MD5C1f, MD5S13);
161
162   MD5_STEP (MD5_H , a, b, c, d, w5_t, MD5C20, MD5S20);
163   MD5_STEP (MD5_H , d, a, b, c, w8_t, MD5C21, MD5S21);
164   MD5_STEP (MD5_H , c, d, a, b, wb_t, MD5C22, MD5S22);
165   MD5_STEP (MD5_H , b, c, d, a, we_t, MD5C23, MD5S23);
166   MD5_STEP (MD5_H , a, b, c, d, w1_t, MD5C24, MD5S20);
167   MD5_STEP (MD5_H , d, a, b, c, w4_t, MD5C25, MD5S21);
168   MD5_STEP (MD5_H , c, d, a, b, w7_t, MD5C26, MD5S22);
169   MD5_STEP (MD5_H , b, c, d, a, wa_t, MD5C27, MD5S23);
170   MD5_STEP (MD5_H , a, b, c, d, wd_t, MD5C28, MD5S20);
171   MD5_STEP (MD5_H , d, a, b, c, w0_t, MD5C29, MD5S21);
172   MD5_STEP (MD5_H , c, d, a, b, w3_t, MD5C2a, MD5S22);
173   MD5_STEP (MD5_H , b, c, d, a, w6_t, MD5C2b, MD5S23);
174   MD5_STEP (MD5_H , a, b, c, d, w9_t, MD5C2c, MD5S20);
175   MD5_STEP (MD5_H , d, a, b, c, wc_t, MD5C2d, MD5S21);
176   MD5_STEP (MD5_H , c, d, a, b, wf_t, MD5C2e, MD5S22);
177   MD5_STEP (MD5_H , b, c, d, a, w2_t, MD5C2f, MD5S23);
178
179   MD5_STEP (MD5_I , a, b, c, d, w0_t, MD5C30, MD5S30);
180   MD5_STEP (MD5_I , d, a, b, c, w7_t, MD5C31, MD5S31);
181   MD5_STEP (MD5_I , c, d, a, b, we_t, MD5C32, MD5S32);
182   MD5_STEP (MD5_I , b, c, d, a, w5_t, MD5C33, MD5S33);
183   MD5_STEP (MD5_I , a, b, c, d, wc_t, MD5C34, MD5S30);
184   MD5_STEP (MD5_I , d, a, b, c, w3_t, MD5C35, MD5S31);
185   MD5_STEP (MD5_I , c, d, a, b, wa_t, MD5C36, MD5S32);
186   MD5_STEP (MD5_I , b, c, d, a, w1_t, MD5C37, MD5S33);
187   MD5_STEP (MD5_I , a, b, c, d, w8_t, MD5C38, MD5S30);
188   MD5_STEP (MD5_I , d, a, b, c, wf_t, MD5C39, MD5S31);
189   MD5_STEP (MD5_I , c, d, a, b, w6_t, MD5C3a, MD5S32);
190   MD5_STEP (MD5_I , b, c, d, a, wd_t, MD5C3b, MD5S33);
191   MD5_STEP (MD5_I , a, b, c, d, w4_t, MD5C3c, MD5S30);
192   MD5_STEP (MD5_I , d, a, b, c, wb_t, MD5C3d, MD5S31);
193   MD5_STEP (MD5_I , c, d, a, b, w2_t, MD5C3e, MD5S32);
194   MD5_STEP (MD5_I , b, c, d, a, w9_t, MD5C3f, MD5S33);
195
196   digest[0] += a;
197   digest[1] += b;
198   digest[2] += c;
199   digest[3] += d;
200 }
201
202 static void hmac_md5_pad (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[4], u32 opad[4])
203 {
204   w0[0] = w0[0] ^ 0x36363636;
205   w0[1] = w0[1] ^ 0x36363636;
206   w0[2] = w0[2] ^ 0x36363636;
207   w0[3] = w0[3] ^ 0x36363636;
208   w1[0] = w1[0] ^ 0x36363636;
209   w1[1] = w1[1] ^ 0x36363636;
210   w1[2] = w1[2] ^ 0x36363636;
211   w1[3] = w1[3] ^ 0x36363636;
212   w2[0] = w2[0] ^ 0x36363636;
213   w2[1] = w2[1] ^ 0x36363636;
214   w2[2] = w2[2] ^ 0x36363636;
215   w2[3] = w2[3] ^ 0x36363636;
216   w3[0] = w3[0] ^ 0x36363636;
217   w3[1] = w3[1] ^ 0x36363636;
218   w3[2] = w3[2] ^ 0x36363636;
219   w3[3] = w3[3] ^ 0x36363636;
220
221   ipad[0] = MD5M_A;
222   ipad[1] = MD5M_B;
223   ipad[2] = MD5M_C;
224   ipad[3] = MD5M_D;
225
226   md5_transform (w0, w1, w2, w3, ipad);
227
228   w0[0] = w0[0] ^ 0x6a6a6a6a;
229   w0[1] = w0[1] ^ 0x6a6a6a6a;
230   w0[2] = w0[2] ^ 0x6a6a6a6a;
231   w0[3] = w0[3] ^ 0x6a6a6a6a;
232   w1[0] = w1[0] ^ 0x6a6a6a6a;
233   w1[1] = w1[1] ^ 0x6a6a6a6a;
234   w1[2] = w1[2] ^ 0x6a6a6a6a;
235   w1[3] = w1[3] ^ 0x6a6a6a6a;
236   w2[0] = w2[0] ^ 0x6a6a6a6a;
237   w2[1] = w2[1] ^ 0x6a6a6a6a;
238   w2[2] = w2[2] ^ 0x6a6a6a6a;
239   w2[3] = w2[3] ^ 0x6a6a6a6a;
240   w3[0] = w3[0] ^ 0x6a6a6a6a;
241   w3[1] = w3[1] ^ 0x6a6a6a6a;
242   w3[2] = w3[2] ^ 0x6a6a6a6a;
243   w3[3] = w3[3] ^ 0x6a6a6a6a;
244
245   opad[0] = MD5M_A;
246   opad[1] = MD5M_B;
247   opad[2] = MD5M_C;
248   opad[3] = MD5M_D;
249
250   md5_transform (w0, w1, w2, w3, opad);
251 }
252
253 static void hmac_md5_run (u32 w0[4], u32 w1[4], u32 w2[4], u32 w3[4], u32 ipad[4], u32 opad[4], u32 digest[4])
254 {
255   digest[0] = ipad[0];
256   digest[1] = ipad[1];
257   digest[2] = ipad[2];
258   digest[3] = ipad[3];
259
260   md5_transform (w0, w1, w2, w3, digest);
261
262   w0[0] = digest[0];
263   w0[1] = digest[1];
264   w0[2] = digest[2];
265   w0[3] = digest[3];
266   w1[0] = 0x80;
267   w1[1] = 0;
268   w1[2] = 0;
269   w1[3] = 0;
270   w2[0] = 0;
271   w2[1] = 0;
272   w2[2] = 0;
273   w2[3] = 0;
274   w3[0] = 0;
275   w3[1] = 0;
276   w3[2] = (64 + 16) * 8;
277   w3[3] = 0;
278
279   digest[0] = opad[0];
280   digest[1] = opad[1];
281   digest[2] = opad[2];
282   digest[3] = opad[3];
283
284   md5_transform (w0, w1, w2, w3, digest);
285 }
286
287 __kernel void m05600_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global netntlm_t *netntlm_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
288 {
289   /**
290    * modifier
291    */
292
293   const u32 gid = get_global_id (0);
294   const u32 lid = get_local_id (0);
295   const u32 lsz = get_local_size (0);
296
297   /**
298    * salt
299    */
300
301   __local u32 s_userdomain_buf[64];
302
303   for (u32 i = lid; i < 64; i += lsz)
304   {
305     s_userdomain_buf[i] = netntlm_bufs[salt_pos].userdomain_buf[i];
306   }
307
308   __local u32 s_chall_buf[256];
309
310   for (u32 i = lid; i < 256; i += lsz)
311   {
312     s_chall_buf[i] = netntlm_bufs[salt_pos].chall_buf[i];
313   }
314
315   barrier (CLK_LOCAL_MEM_FENCE);
316
317   if (gid >= gid_max) return;
318
319   const u32 userdomain_len = netntlm_bufs[salt_pos].user_len
320                            + netntlm_bufs[salt_pos].domain_len;
321
322   const u32 chall_len = netntlm_bufs[salt_pos].srvchall_len
323                       + netntlm_bufs[salt_pos].clichall_len;
324
325   /**
326    * base
327    */
328
329   u32 wordl0[4];
330
331   wordl0[0] = pws[gid].i[ 0];
332   wordl0[1] = pws[gid].i[ 1];
333   wordl0[2] = pws[gid].i[ 2];
334   wordl0[3] = pws[gid].i[ 3];
335
336   u32 wordl1[4];
337
338   wordl1[0] = pws[gid].i[ 4];
339   wordl1[1] = pws[gid].i[ 5];
340   wordl1[2] = pws[gid].i[ 6];
341   wordl1[3] = pws[gid].i[ 7];
342
343   u32 wordl2[4];
344
345   wordl2[0] = 0;
346   wordl2[1] = 0;
347   wordl2[2] = 0;
348   wordl2[3] = 0;
349
350   u32 wordl3[4];
351
352   wordl3[0] = 0;
353   wordl3[1] = 0;
354   wordl3[2] = 0;
355   wordl3[3] = 0;
356
357   const u32 pw_l_len = pws[gid].pw_len;
358
359   if (combs_mode == COMBINATOR_MODE_BASE_RIGHT)
360   {
361     append_0x80_2x4 (wordl0, wordl1, pw_l_len);
362
363     switch_buffer_by_offset (wordl0, wordl1, wordl2, wordl3, combs_buf[0].pw_len);
364   }
365
366   /**
367    * loop
368    */
369
370   for (u32 il_pos = 0; il_pos < combs_cnt; il_pos++)
371   {
372     const u32 pw_r_len = combs_buf[il_pos].pw_len;
373
374     const u32 pw_len = pw_l_len + pw_r_len;
375
376     u32 wordr0[4];
377
378     wordr0[0] = combs_buf[il_pos].i[0];
379     wordr0[1] = combs_buf[il_pos].i[1];
380     wordr0[2] = combs_buf[il_pos].i[2];
381     wordr0[3] = combs_buf[il_pos].i[3];
382
383     u32 wordr1[4];
384
385     wordr1[0] = combs_buf[il_pos].i[4];
386     wordr1[1] = combs_buf[il_pos].i[5];
387     wordr1[2] = combs_buf[il_pos].i[6];
388     wordr1[3] = combs_buf[il_pos].i[7];
389
390     u32 wordr2[4];
391
392     wordr2[0] = 0;
393     wordr2[1] = 0;
394     wordr2[2] = 0;
395     wordr2[3] = 0;
396
397     u32 wordr3[4];
398
399     wordr3[0] = 0;
400     wordr3[1] = 0;
401     wordr3[2] = 0;
402     wordr3[3] = 0;
403
404     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
405     {
406       switch_buffer_by_offset (wordr0, wordr1, wordr2, wordr3, pw_l_len);
407     }
408
409     u32 w0[4];
410
411     w0[0] = wordl0[0] | wordr0[0];
412     w0[1] = wordl0[1] | wordr0[1];
413     w0[2] = wordl0[2] | wordr0[2];
414     w0[3] = wordl0[3] | wordr0[3];
415
416     u32 w1[4];
417
418     w1[0] = wordl1[0] | wordr1[0];
419     w1[1] = wordl1[1] | wordr1[1];
420     w1[2] = wordl1[2] | wordr1[2];
421     w1[3] = wordl1[3] | wordr1[3];
422
423     u32 w2[4];
424
425     w2[0] = 0;
426     w2[1] = 0;
427     w2[2] = 0;
428     w2[3] = 0;
429
430     u32 w3[4];
431
432     w3[0] = 0;
433     w3[1] = 0;
434     w3[2] = 0;
435     w3[3] = 0;
436
437     u32 w0_t[4];
438     u32 w1_t[4];
439     u32 w2_t[4];
440     u32 w3_t[4];
441
442     make_unicode (w0, w0_t, w1_t);
443     make_unicode (w1, w2_t, w3_t);
444
445     w3_t[2] = pw_len * 8 * 2;
446
447     u32 digest[4];
448
449     digest[0] = MD4M_A;
450     digest[1] = MD4M_B;
451     digest[2] = MD4M_C;
452     digest[3] = MD4M_D;
453
454     md4_transform (w0_t, w1_t, w2_t, w3_t, digest);
455
456     w0_t[0] = digest[0];
457     w0_t[1] = digest[1];
458     w0_t[2] = digest[2];
459     w0_t[3] = digest[3];
460     w1_t[0] = 0;
461     w1_t[1] = 0;
462     w1_t[2] = 0;
463     w1_t[3] = 0;
464     w2_t[0] = 0;
465     w2_t[1] = 0;
466     w2_t[2] = 0;
467     w2_t[3] = 0;
468     w3_t[0] = 0;
469     w3_t[1] = 0;
470     w3_t[2] = 0;
471     w3_t[3] = 0;
472
473     digest[0] = MD5M_A;
474     digest[1] = MD5M_B;
475     digest[2] = MD5M_C;
476     digest[3] = MD5M_D;
477
478     u32 ipad[4];
479     u32 opad[4];
480
481     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
482
483     int left;
484     int off;
485
486     for (left = userdomain_len, off = 0; left >= 56; left -= 64, off += 16)
487     {
488       w0_t[0] = s_userdomain_buf[off +  0];
489       w0_t[1] = s_userdomain_buf[off +  1];
490       w0_t[2] = s_userdomain_buf[off +  2];
491       w0_t[3] = s_userdomain_buf[off +  3];
492       w1_t[0] = s_userdomain_buf[off +  4];
493       w1_t[1] = s_userdomain_buf[off +  5];
494       w1_t[2] = s_userdomain_buf[off +  6];
495       w1_t[3] = s_userdomain_buf[off +  7];
496       w2_t[0] = s_userdomain_buf[off +  8];
497       w2_t[1] = s_userdomain_buf[off +  9];
498       w2_t[2] = s_userdomain_buf[off + 10];
499       w2_t[3] = s_userdomain_buf[off + 11];
500       w3_t[0] = s_userdomain_buf[off + 12];
501       w3_t[1] = s_userdomain_buf[off + 13];
502       w3_t[2] = s_userdomain_buf[off + 14];
503       w3_t[3] = s_userdomain_buf[off + 15];
504
505       md5_transform (w0_t, w1_t, w2_t, w3_t, ipad);
506     }
507
508     w0_t[0] = s_userdomain_buf[off +  0];
509     w0_t[1] = s_userdomain_buf[off +  1];
510     w0_t[2] = s_userdomain_buf[off +  2];
511     w0_t[3] = s_userdomain_buf[off +  3];
512     w1_t[0] = s_userdomain_buf[off +  4];
513     w1_t[1] = s_userdomain_buf[off +  5];
514     w1_t[2] = s_userdomain_buf[off +  6];
515     w1_t[3] = s_userdomain_buf[off +  7];
516     w2_t[0] = s_userdomain_buf[off +  8];
517     w2_t[1] = s_userdomain_buf[off +  9];
518     w2_t[2] = s_userdomain_buf[off + 10];
519     w2_t[3] = s_userdomain_buf[off + 11];
520     w3_t[0] = s_userdomain_buf[off + 12];
521     w3_t[1] = s_userdomain_buf[off + 13];
522     w3_t[2] = (64 + userdomain_len) * 8;
523     w3_t[3] = 0;
524
525     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
526
527     w0_t[0] = digest[0];
528     w0_t[1] = digest[1];
529     w0_t[2] = digest[2];
530     w0_t[3] = digest[3];
531     w1_t[0] = 0;
532     w1_t[1] = 0;
533     w1_t[2] = 0;
534     w1_t[3] = 0;
535     w2_t[0] = 0;
536     w2_t[1] = 0;
537     w2_t[2] = 0;
538     w2_t[3] = 0;
539     w3_t[0] = 0;
540     w3_t[1] = 0;
541     w3_t[2] = 0;
542     w3_t[3] = 0;
543
544     digest[0] = MD5M_A;
545     digest[1] = MD5M_B;
546     digest[2] = MD5M_C;
547     digest[3] = MD5M_D;
548
549     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
550
551     for (left = chall_len, off = 0; left >= 56; left -= 64, off += 16)
552     {
553       w0_t[0] = s_chall_buf[off +  0];
554       w0_t[1] = s_chall_buf[off +  1];
555       w0_t[2] = s_chall_buf[off +  2];
556       w0_t[3] = s_chall_buf[off +  3];
557       w1_t[0] = s_chall_buf[off +  4];
558       w1_t[1] = s_chall_buf[off +  5];
559       w1_t[2] = s_chall_buf[off +  6];
560       w1_t[3] = s_chall_buf[off +  7];
561       w2_t[0] = s_chall_buf[off +  8];
562       w2_t[1] = s_chall_buf[off +  9];
563       w2_t[2] = s_chall_buf[off + 10];
564       w2_t[3] = s_chall_buf[off + 11];
565       w3_t[0] = s_chall_buf[off + 12];
566       w3_t[1] = s_chall_buf[off + 13];
567       w3_t[2] = s_chall_buf[off + 14];
568       w3_t[3] = s_chall_buf[off + 15];
569
570       md5_transform (w0_t, w1_t, w2_t, w3_t, ipad);
571     }
572
573     w0_t[0] = s_chall_buf[off +  0];
574     w0_t[1] = s_chall_buf[off +  1];
575     w0_t[2] = s_chall_buf[off +  2];
576     w0_t[3] = s_chall_buf[off +  3];
577     w1_t[0] = s_chall_buf[off +  4];
578     w1_t[1] = s_chall_buf[off +  5];
579     w1_t[2] = s_chall_buf[off +  6];
580     w1_t[3] = s_chall_buf[off +  7];
581     w2_t[0] = s_chall_buf[off +  8];
582     w2_t[1] = s_chall_buf[off +  9];
583     w2_t[2] = s_chall_buf[off + 10];
584     w2_t[3] = s_chall_buf[off + 11];
585     w3_t[0] = s_chall_buf[off + 12];
586     w3_t[1] = s_chall_buf[off + 13];
587     w3_t[2] = (64 + chall_len) * 8;
588     w3_t[3] = 0;
589
590     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
591
592     const u32 r0 = digest[0];
593     const u32 r1 = digest[3];
594     const u32 r2 = digest[2];
595     const u32 r3 = digest[1];
596
597     #include COMPARE_M
598   }
599 }
600
601 __kernel void m05600_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global netntlm_t *netntlm_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
602 {
603 }
604
605 __kernel void m05600_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global netntlm_t *netntlm_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
606 {
607 }
608
609 __kernel void m05600_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global netntlm_t *netntlm_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
610 {
611   /**
612    * modifier
613    */
614
615   const u32 gid = get_global_id (0);
616   const u32 lid = get_local_id (0);
617   const u32 lsz = get_local_size (0);
618
619   /**
620    * salt
621    */
622
623   __local u32 s_userdomain_buf[64];
624
625   for (u32 i = lid; i < 64; i += lsz)
626   {
627     s_userdomain_buf[i] = netntlm_bufs[salt_pos].userdomain_buf[i];
628   }
629
630   __local u32 s_chall_buf[256];
631
632   for (u32 i = lid; i < 256; i += lsz)
633   {
634     s_chall_buf[i] = netntlm_bufs[salt_pos].chall_buf[i];
635   }
636
637   barrier (CLK_LOCAL_MEM_FENCE);
638
639   if (gid >= gid_max) return;
640
641   const u32 userdomain_len = netntlm_bufs[salt_pos].user_len
642                            + netntlm_bufs[salt_pos].domain_len;
643
644   const u32 chall_len = netntlm_bufs[salt_pos].srvchall_len
645                       + netntlm_bufs[salt_pos].clichall_len;
646
647   /**
648    * base
649    */
650
651   u32 wordl0[4];
652
653   wordl0[0] = pws[gid].i[ 0];
654   wordl0[1] = pws[gid].i[ 1];
655   wordl0[2] = pws[gid].i[ 2];
656   wordl0[3] = pws[gid].i[ 3];
657
658   u32 wordl1[4];
659
660   wordl1[0] = pws[gid].i[ 4];
661   wordl1[1] = pws[gid].i[ 5];
662   wordl1[2] = pws[gid].i[ 6];
663   wordl1[3] = pws[gid].i[ 7];
664
665   u32 wordl2[4];
666
667   wordl2[0] = 0;
668   wordl2[1] = 0;
669   wordl2[2] = 0;
670   wordl2[3] = 0;
671
672   u32 wordl3[4];
673
674   wordl3[0] = 0;
675   wordl3[1] = 0;
676   wordl3[2] = 0;
677   wordl3[3] = 0;
678
679   const u32 pw_l_len = pws[gid].pw_len;
680
681   if (combs_mode == COMBINATOR_MODE_BASE_RIGHT)
682   {
683     append_0x80_2x4 (wordl0, wordl1, pw_l_len);
684
685     switch_buffer_by_offset (wordl0, wordl1, wordl2, wordl3, combs_buf[0].pw_len);
686   }
687
688   /**
689    * digest
690    */
691
692   const u32 search[4] =
693   {
694     digests_buf[digests_offset].digest_buf[DGST_R0],
695     digests_buf[digests_offset].digest_buf[DGST_R1],
696     digests_buf[digests_offset].digest_buf[DGST_R2],
697     digests_buf[digests_offset].digest_buf[DGST_R3]
698   };
699
700   /**
701    * loop
702    */
703
704   for (u32 il_pos = 0; il_pos < combs_cnt; il_pos++)
705   {
706     const u32 pw_r_len = combs_buf[il_pos].pw_len;
707
708     const u32 pw_len = pw_l_len + pw_r_len;
709
710     u32 wordr0[4];
711
712     wordr0[0] = combs_buf[il_pos].i[0];
713     wordr0[1] = combs_buf[il_pos].i[1];
714     wordr0[2] = combs_buf[il_pos].i[2];
715     wordr0[3] = combs_buf[il_pos].i[3];
716
717     u32 wordr1[4];
718
719     wordr1[0] = combs_buf[il_pos].i[4];
720     wordr1[1] = combs_buf[il_pos].i[5];
721     wordr1[2] = combs_buf[il_pos].i[6];
722     wordr1[3] = combs_buf[il_pos].i[7];
723
724     u32 wordr2[4];
725
726     wordr2[0] = 0;
727     wordr2[1] = 0;
728     wordr2[2] = 0;
729     wordr2[3] = 0;
730
731     u32 wordr3[4];
732
733     wordr3[0] = 0;
734     wordr3[1] = 0;
735     wordr3[2] = 0;
736     wordr3[3] = 0;
737
738     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
739     {
740       switch_buffer_by_offset (wordr0, wordr1, wordr2, wordr3, pw_l_len);
741     }
742
743     u32 w0[4];
744
745     w0[0] = wordl0[0] | wordr0[0];
746     w0[1] = wordl0[1] | wordr0[1];
747     w0[2] = wordl0[2] | wordr0[2];
748     w0[3] = wordl0[3] | wordr0[3];
749
750     u32 w1[4];
751
752     w1[0] = wordl1[0] | wordr1[0];
753     w1[1] = wordl1[1] | wordr1[1];
754     w1[2] = wordl1[2] | wordr1[2];
755     w1[3] = wordl1[3] | wordr1[3];
756
757     u32 w2[4];
758
759     w2[0] = 0;
760     w2[1] = 0;
761     w2[2] = 0;
762     w2[3] = 0;
763
764     u32 w3[4];
765
766     w3[0] = 0;
767     w3[1] = 0;
768     w3[2] = 0;
769     w3[3] = 0;
770
771     u32 w0_t[4];
772     u32 w1_t[4];
773     u32 w2_t[4];
774     u32 w3_t[4];
775
776     make_unicode (w0, w0_t, w1_t);
777     make_unicode (w1, w2_t, w3_t);
778
779     w3_t[2] = pw_len * 8 * 2;
780
781     u32 digest[4];
782
783     digest[0] = MD4M_A;
784     digest[1] = MD4M_B;
785     digest[2] = MD4M_C;
786     digest[3] = MD4M_D;
787
788     md4_transform (w0_t, w1_t, w2_t, w3_t, digest);
789
790     w0_t[0] = digest[0];
791     w0_t[1] = digest[1];
792     w0_t[2] = digest[2];
793     w0_t[3] = digest[3];
794     w1_t[0] = 0;
795     w1_t[1] = 0;
796     w1_t[2] = 0;
797     w1_t[3] = 0;
798     w2_t[0] = 0;
799     w2_t[1] = 0;
800     w2_t[2] = 0;
801     w2_t[3] = 0;
802     w3_t[0] = 0;
803     w3_t[1] = 0;
804     w3_t[2] = 0;
805     w3_t[3] = 0;
806
807     digest[0] = MD5M_A;
808     digest[1] = MD5M_B;
809     digest[2] = MD5M_C;
810     digest[3] = MD5M_D;
811
812     u32 ipad[4];
813     u32 opad[4];
814
815     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
816
817     int left;
818     int off;
819
820     for (left = userdomain_len, off = 0; left >= 56; left -= 64, off += 16)
821     {
822       w0_t[0] = s_userdomain_buf[off +  0];
823       w0_t[1] = s_userdomain_buf[off +  1];
824       w0_t[2] = s_userdomain_buf[off +  2];
825       w0_t[3] = s_userdomain_buf[off +  3];
826       w1_t[0] = s_userdomain_buf[off +  4];
827       w1_t[1] = s_userdomain_buf[off +  5];
828       w1_t[2] = s_userdomain_buf[off +  6];
829       w1_t[3] = s_userdomain_buf[off +  7];
830       w2_t[0] = s_userdomain_buf[off +  8];
831       w2_t[1] = s_userdomain_buf[off +  9];
832       w2_t[2] = s_userdomain_buf[off + 10];
833       w2_t[3] = s_userdomain_buf[off + 11];
834       w3_t[0] = s_userdomain_buf[off + 12];
835       w3_t[1] = s_userdomain_buf[off + 13];
836       w3_t[2] = s_userdomain_buf[off + 14];
837       w3_t[3] = s_userdomain_buf[off + 15];
838
839       md5_transform (w0_t, w1_t, w2_t, w3_t, ipad);
840     }
841
842     w0_t[0] = s_userdomain_buf[off +  0];
843     w0_t[1] = s_userdomain_buf[off +  1];
844     w0_t[2] = s_userdomain_buf[off +  2];
845     w0_t[3] = s_userdomain_buf[off +  3];
846     w1_t[0] = s_userdomain_buf[off +  4];
847     w1_t[1] = s_userdomain_buf[off +  5];
848     w1_t[2] = s_userdomain_buf[off +  6];
849     w1_t[3] = s_userdomain_buf[off +  7];
850     w2_t[0] = s_userdomain_buf[off +  8];
851     w2_t[1] = s_userdomain_buf[off +  9];
852     w2_t[2] = s_userdomain_buf[off + 10];
853     w2_t[3] = s_userdomain_buf[off + 11];
854     w3_t[0] = s_userdomain_buf[off + 12];
855     w3_t[1] = s_userdomain_buf[off + 13];
856     w3_t[2] = (64 + userdomain_len) * 8;
857     w3_t[3] = 0;
858
859     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
860
861     w0_t[0] = digest[0];
862     w0_t[1] = digest[1];
863     w0_t[2] = digest[2];
864     w0_t[3] = digest[3];
865     w1_t[0] = 0;
866     w1_t[1] = 0;
867     w1_t[2] = 0;
868     w1_t[3] = 0;
869     w2_t[0] = 0;
870     w2_t[1] = 0;
871     w2_t[2] = 0;
872     w2_t[3] = 0;
873     w3_t[0] = 0;
874     w3_t[1] = 0;
875     w3_t[2] = 0;
876     w3_t[3] = 0;
877
878     digest[0] = MD5M_A;
879     digest[1] = MD5M_B;
880     digest[2] = MD5M_C;
881     digest[3] = MD5M_D;
882
883     hmac_md5_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
884
885     for (left = chall_len, off = 0; left >= 56; left -= 64, off += 16)
886     {
887       w0_t[0] = s_chall_buf[off +  0];
888       w0_t[1] = s_chall_buf[off +  1];
889       w0_t[2] = s_chall_buf[off +  2];
890       w0_t[3] = s_chall_buf[off +  3];
891       w1_t[0] = s_chall_buf[off +  4];
892       w1_t[1] = s_chall_buf[off +  5];
893       w1_t[2] = s_chall_buf[off +  6];
894       w1_t[3] = s_chall_buf[off +  7];
895       w2_t[0] = s_chall_buf[off +  8];
896       w2_t[1] = s_chall_buf[off +  9];
897       w2_t[2] = s_chall_buf[off + 10];
898       w2_t[3] = s_chall_buf[off + 11];
899       w3_t[0] = s_chall_buf[off + 12];
900       w3_t[1] = s_chall_buf[off + 13];
901       w3_t[2] = s_chall_buf[off + 14];
902       w3_t[3] = s_chall_buf[off + 15];
903
904       md5_transform (w0_t, w1_t, w2_t, w3_t, ipad);
905     }
906
907     w0_t[0] = s_chall_buf[off +  0];
908     w0_t[1] = s_chall_buf[off +  1];
909     w0_t[2] = s_chall_buf[off +  2];
910     w0_t[3] = s_chall_buf[off +  3];
911     w1_t[0] = s_chall_buf[off +  4];
912     w1_t[1] = s_chall_buf[off +  5];
913     w1_t[2] = s_chall_buf[off +  6];
914     w1_t[3] = s_chall_buf[off +  7];
915     w2_t[0] = s_chall_buf[off +  8];
916     w2_t[1] = s_chall_buf[off +  9];
917     w2_t[2] = s_chall_buf[off + 10];
918     w2_t[3] = s_chall_buf[off + 11];
919     w3_t[0] = s_chall_buf[off + 12];
920     w3_t[1] = s_chall_buf[off + 13];
921     w3_t[2] = (64 + chall_len) * 8;
922     w3_t[3] = 0;
923
924     hmac_md5_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
925
926     const u32 r0 = digest[0];
927     const u32 r1 = digest[3];
928     const u32 r2 = digest[2];
929     const u32 r3 = digest[1];
930
931     #include COMPARE_S
932   }
933 }
934
935 __kernel void m05600_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global netntlm_t *netntlm_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
936 {
937 }
938
939 __kernel void m05600_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global netntlm_t *netntlm_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
940 {
941 }