Fixed all gpu code (see PR #179 for details)
[hashcat.git] / OpenCL / m03000_a0.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _DES_
9
10 #include "include/constants.h"
11 #include "include/kernel_vendor.h"
12
13 #define DGST_R0 0
14 #define DGST_R1 1
15 #define DGST_R2 2
16 #define DGST_R3 3
17
18 #include "include/kernel_functions.c"
19 #include "OpenCL/types_ocl.c"
20 #include "OpenCL/common.c"
21 #include "include/rp_kernel.h"
22 #include "OpenCL/rp.c"
23
24 #define COMPARE_S "OpenCL/check_single_comp4.c"
25 #define COMPARE_M "OpenCL/check_multi_comp4.c"
26
27 #define PERM_OP(a,b,tt,n,m) \
28 {                           \
29   tt = a >> n;              \
30   tt = tt ^ b;              \
31   tt = tt & m;              \
32   b = b ^ tt;               \
33   tt = tt << n;             \
34   a = a ^ tt;               \
35 }
36
37 #define HPERM_OP(a,tt,n,m)  \
38 {                           \
39   tt = a << (16 + n);       \
40   tt = tt ^ a;              \
41   tt = tt & m;              \
42   a  = a ^ tt;              \
43   tt = tt >> (16 + n);      \
44   a  = a ^ tt;              \
45 }
46
47 __constant u32 c_SPtrans[8][64] =
48 {
49   {
50     0x02080800, 0x00080000, 0x02000002, 0x02080802,
51     0x02000000, 0x00080802, 0x00080002, 0x02000002,
52     0x00080802, 0x02080800, 0x02080000, 0x00000802,
53     0x02000802, 0x02000000, 0x00000000, 0x00080002,
54     0x00080000, 0x00000002, 0x02000800, 0x00080800,
55     0x02080802, 0x02080000, 0x00000802, 0x02000800,
56     0x00000002, 0x00000800, 0x00080800, 0x02080002,
57     0x00000800, 0x02000802, 0x02080002, 0x00000000,
58     0x00000000, 0x02080802, 0x02000800, 0x00080002,
59     0x02080800, 0x00080000, 0x00000802, 0x02000800,
60     0x02080002, 0x00000800, 0x00080800, 0x02000002,
61     0x00080802, 0x00000002, 0x02000002, 0x02080000,
62     0x02080802, 0x00080800, 0x02080000, 0x02000802,
63     0x02000000, 0x00000802, 0x00080002, 0x00000000,
64     0x00080000, 0x02000000, 0x02000802, 0x02080800,
65     0x00000002, 0x02080002, 0x00000800, 0x00080802,
66   },
67   {
68     0x40108010, 0x00000000, 0x00108000, 0x40100000,
69     0x40000010, 0x00008010, 0x40008000, 0x00108000,
70     0x00008000, 0x40100010, 0x00000010, 0x40008000,
71     0x00100010, 0x40108000, 0x40100000, 0x00000010,
72     0x00100000, 0x40008010, 0x40100010, 0x00008000,
73     0x00108010, 0x40000000, 0x00000000, 0x00100010,
74     0x40008010, 0x00108010, 0x40108000, 0x40000010,
75     0x40000000, 0x00100000, 0x00008010, 0x40108010,
76     0x00100010, 0x40108000, 0x40008000, 0x00108010,
77     0x40108010, 0x00100010, 0x40000010, 0x00000000,
78     0x40000000, 0x00008010, 0x00100000, 0x40100010,
79     0x00008000, 0x40000000, 0x00108010, 0x40008010,
80     0x40108000, 0x00008000, 0x00000000, 0x40000010,
81     0x00000010, 0x40108010, 0x00108000, 0x40100000,
82     0x40100010, 0x00100000, 0x00008010, 0x40008000,
83     0x40008010, 0x00000010, 0x40100000, 0x00108000,
84   },
85   {
86     0x04000001, 0x04040100, 0x00000100, 0x04000101,
87     0x00040001, 0x04000000, 0x04000101, 0x00040100,
88     0x04000100, 0x00040000, 0x04040000, 0x00000001,
89     0x04040101, 0x00000101, 0x00000001, 0x04040001,
90     0x00000000, 0x00040001, 0x04040100, 0x00000100,
91     0x00000101, 0x04040101, 0x00040000, 0x04000001,
92     0x04040001, 0x04000100, 0x00040101, 0x04040000,
93     0x00040100, 0x00000000, 0x04000000, 0x00040101,
94     0x04040100, 0x00000100, 0x00000001, 0x00040000,
95     0x00000101, 0x00040001, 0x04040000, 0x04000101,
96     0x00000000, 0x04040100, 0x00040100, 0x04040001,
97     0x00040001, 0x04000000, 0x04040101, 0x00000001,
98     0x00040101, 0x04000001, 0x04000000, 0x04040101,
99     0x00040000, 0x04000100, 0x04000101, 0x00040100,
100     0x04000100, 0x00000000, 0x04040001, 0x00000101,
101     0x04000001, 0x00040101, 0x00000100, 0x04040000,
102   },
103   {
104     0x00401008, 0x10001000, 0x00000008, 0x10401008,
105     0x00000000, 0x10400000, 0x10001008, 0x00400008,
106     0x10401000, 0x10000008, 0x10000000, 0x00001008,
107     0x10000008, 0x00401008, 0x00400000, 0x10000000,
108     0x10400008, 0x00401000, 0x00001000, 0x00000008,
109     0x00401000, 0x10001008, 0x10400000, 0x00001000,
110     0x00001008, 0x00000000, 0x00400008, 0x10401000,
111     0x10001000, 0x10400008, 0x10401008, 0x00400000,
112     0x10400008, 0x00001008, 0x00400000, 0x10000008,
113     0x00401000, 0x10001000, 0x00000008, 0x10400000,
114     0x10001008, 0x00000000, 0x00001000, 0x00400008,
115     0x00000000, 0x10400008, 0x10401000, 0x00001000,
116     0x10000000, 0x10401008, 0x00401008, 0x00400000,
117     0x10401008, 0x00000008, 0x10001000, 0x00401008,
118     0x00400008, 0x00401000, 0x10400000, 0x10001008,
119     0x00001008, 0x10000000, 0x10000008, 0x10401000,
120   },
121   {
122     0x08000000, 0x00010000, 0x00000400, 0x08010420,
123     0x08010020, 0x08000400, 0x00010420, 0x08010000,
124     0x00010000, 0x00000020, 0x08000020, 0x00010400,
125     0x08000420, 0x08010020, 0x08010400, 0x00000000,
126     0x00010400, 0x08000000, 0x00010020, 0x00000420,
127     0x08000400, 0x00010420, 0x00000000, 0x08000020,
128     0x00000020, 0x08000420, 0x08010420, 0x00010020,
129     0x08010000, 0x00000400, 0x00000420, 0x08010400,
130     0x08010400, 0x08000420, 0x00010020, 0x08010000,
131     0x00010000, 0x00000020, 0x08000020, 0x08000400,
132     0x08000000, 0x00010400, 0x08010420, 0x00000000,
133     0x00010420, 0x08000000, 0x00000400, 0x00010020,
134     0x08000420, 0x00000400, 0x00000000, 0x08010420,
135     0x08010020, 0x08010400, 0x00000420, 0x00010000,
136     0x00010400, 0x08010020, 0x08000400, 0x00000420,
137     0x00000020, 0x00010420, 0x08010000, 0x08000020,
138   },
139   {
140     0x80000040, 0x00200040, 0x00000000, 0x80202000,
141     0x00200040, 0x00002000, 0x80002040, 0x00200000,
142     0x00002040, 0x80202040, 0x00202000, 0x80000000,
143     0x80002000, 0x80000040, 0x80200000, 0x00202040,
144     0x00200000, 0x80002040, 0x80200040, 0x00000000,
145     0x00002000, 0x00000040, 0x80202000, 0x80200040,
146     0x80202040, 0x80200000, 0x80000000, 0x00002040,
147     0x00000040, 0x00202000, 0x00202040, 0x80002000,
148     0x00002040, 0x80000000, 0x80002000, 0x00202040,
149     0x80202000, 0x00200040, 0x00000000, 0x80002000,
150     0x80000000, 0x00002000, 0x80200040, 0x00200000,
151     0x00200040, 0x80202040, 0x00202000, 0x00000040,
152     0x80202040, 0x00202000, 0x00200000, 0x80002040,
153     0x80000040, 0x80200000, 0x00202040, 0x00000000,
154     0x00002000, 0x80000040, 0x80002040, 0x80202000,
155     0x80200000, 0x00002040, 0x00000040, 0x80200040,
156   },
157   {
158     0x00004000, 0x00000200, 0x01000200, 0x01000004,
159     0x01004204, 0x00004004, 0x00004200, 0x00000000,
160     0x01000000, 0x01000204, 0x00000204, 0x01004000,
161     0x00000004, 0x01004200, 0x01004000, 0x00000204,
162     0x01000204, 0x00004000, 0x00004004, 0x01004204,
163     0x00000000, 0x01000200, 0x01000004, 0x00004200,
164     0x01004004, 0x00004204, 0x01004200, 0x00000004,
165     0x00004204, 0x01004004, 0x00000200, 0x01000000,
166     0x00004204, 0x01004000, 0x01004004, 0x00000204,
167     0x00004000, 0x00000200, 0x01000000, 0x01004004,
168     0x01000204, 0x00004204, 0x00004200, 0x00000000,
169     0x00000200, 0x01000004, 0x00000004, 0x01000200,
170     0x00000000, 0x01000204, 0x01000200, 0x00004200,
171     0x00000204, 0x00004000, 0x01004204, 0x01000000,
172     0x01004200, 0x00000004, 0x00004004, 0x01004204,
173     0x01000004, 0x01004200, 0x01004000, 0x00004004,
174   },
175   {
176     0x20800080, 0x20820000, 0x00020080, 0x00000000,
177     0x20020000, 0x00800080, 0x20800000, 0x20820080,
178     0x00000080, 0x20000000, 0x00820000, 0x00020080,
179     0x00820080, 0x20020080, 0x20000080, 0x20800000,
180     0x00020000, 0x00820080, 0x00800080, 0x20020000,
181     0x20820080, 0x20000080, 0x00000000, 0x00820000,
182     0x20000000, 0x00800000, 0x20020080, 0x20800080,
183     0x00800000, 0x00020000, 0x20820000, 0x00000080,
184     0x00800000, 0x00020000, 0x20000080, 0x20820080,
185     0x00020080, 0x20000000, 0x00000000, 0x00820000,
186     0x20800080, 0x20020080, 0x20020000, 0x00800080,
187     0x20820000, 0x00000080, 0x00800080, 0x20020000,
188     0x20820080, 0x00800000, 0x20800000, 0x20000080,
189     0x00820000, 0x00020080, 0x20020080, 0x20800000,
190     0x00000080, 0x20820000, 0x00820080, 0x00000000,
191     0x20000000, 0x20800080, 0x00020000, 0x00820080,
192   }
193 };
194
195 __constant u32 c_skb[8][64] =
196 {
197   {
198     0x00000000, 0x00000010, 0x20000000, 0x20000010,
199     0x00010000, 0x00010010, 0x20010000, 0x20010010,
200     0x00000800, 0x00000810, 0x20000800, 0x20000810,
201     0x00010800, 0x00010810, 0x20010800, 0x20010810,
202     0x00000020, 0x00000030, 0x20000020, 0x20000030,
203     0x00010020, 0x00010030, 0x20010020, 0x20010030,
204     0x00000820, 0x00000830, 0x20000820, 0x20000830,
205     0x00010820, 0x00010830, 0x20010820, 0x20010830,
206     0x00080000, 0x00080010, 0x20080000, 0x20080010,
207     0x00090000, 0x00090010, 0x20090000, 0x20090010,
208     0x00080800, 0x00080810, 0x20080800, 0x20080810,
209     0x00090800, 0x00090810, 0x20090800, 0x20090810,
210     0x00080020, 0x00080030, 0x20080020, 0x20080030,
211     0x00090020, 0x00090030, 0x20090020, 0x20090030,
212     0x00080820, 0x00080830, 0x20080820, 0x20080830,
213     0x00090820, 0x00090830, 0x20090820, 0x20090830,
214   },
215   {
216     0x00000000, 0x02000000, 0x00002000, 0x02002000,
217     0x00200000, 0x02200000, 0x00202000, 0x02202000,
218     0x00000004, 0x02000004, 0x00002004, 0x02002004,
219     0x00200004, 0x02200004, 0x00202004, 0x02202004,
220     0x00000400, 0x02000400, 0x00002400, 0x02002400,
221     0x00200400, 0x02200400, 0x00202400, 0x02202400,
222     0x00000404, 0x02000404, 0x00002404, 0x02002404,
223     0x00200404, 0x02200404, 0x00202404, 0x02202404,
224     0x10000000, 0x12000000, 0x10002000, 0x12002000,
225     0x10200000, 0x12200000, 0x10202000, 0x12202000,
226     0x10000004, 0x12000004, 0x10002004, 0x12002004,
227     0x10200004, 0x12200004, 0x10202004, 0x12202004,
228     0x10000400, 0x12000400, 0x10002400, 0x12002400,
229     0x10200400, 0x12200400, 0x10202400, 0x12202400,
230     0x10000404, 0x12000404, 0x10002404, 0x12002404,
231     0x10200404, 0x12200404, 0x10202404, 0x12202404,
232   },
233   {
234     0x00000000, 0x00000001, 0x00040000, 0x00040001,
235     0x01000000, 0x01000001, 0x01040000, 0x01040001,
236     0x00000002, 0x00000003, 0x00040002, 0x00040003,
237     0x01000002, 0x01000003, 0x01040002, 0x01040003,
238     0x00000200, 0x00000201, 0x00040200, 0x00040201,
239     0x01000200, 0x01000201, 0x01040200, 0x01040201,
240     0x00000202, 0x00000203, 0x00040202, 0x00040203,
241     0x01000202, 0x01000203, 0x01040202, 0x01040203,
242     0x08000000, 0x08000001, 0x08040000, 0x08040001,
243     0x09000000, 0x09000001, 0x09040000, 0x09040001,
244     0x08000002, 0x08000003, 0x08040002, 0x08040003,
245     0x09000002, 0x09000003, 0x09040002, 0x09040003,
246     0x08000200, 0x08000201, 0x08040200, 0x08040201,
247     0x09000200, 0x09000201, 0x09040200, 0x09040201,
248     0x08000202, 0x08000203, 0x08040202, 0x08040203,
249     0x09000202, 0x09000203, 0x09040202, 0x09040203,
250   },
251   {
252     0x00000000, 0x00100000, 0x00000100, 0x00100100,
253     0x00000008, 0x00100008, 0x00000108, 0x00100108,
254     0x00001000, 0x00101000, 0x00001100, 0x00101100,
255     0x00001008, 0x00101008, 0x00001108, 0x00101108,
256     0x04000000, 0x04100000, 0x04000100, 0x04100100,
257     0x04000008, 0x04100008, 0x04000108, 0x04100108,
258     0x04001000, 0x04101000, 0x04001100, 0x04101100,
259     0x04001008, 0x04101008, 0x04001108, 0x04101108,
260     0x00020000, 0x00120000, 0x00020100, 0x00120100,
261     0x00020008, 0x00120008, 0x00020108, 0x00120108,
262     0x00021000, 0x00121000, 0x00021100, 0x00121100,
263     0x00021008, 0x00121008, 0x00021108, 0x00121108,
264     0x04020000, 0x04120000, 0x04020100, 0x04120100,
265     0x04020008, 0x04120008, 0x04020108, 0x04120108,
266     0x04021000, 0x04121000, 0x04021100, 0x04121100,
267     0x04021008, 0x04121008, 0x04021108, 0x04121108,
268   },
269   {
270     0x00000000, 0x10000000, 0x00010000, 0x10010000,
271     0x00000004, 0x10000004, 0x00010004, 0x10010004,
272     0x20000000, 0x30000000, 0x20010000, 0x30010000,
273     0x20000004, 0x30000004, 0x20010004, 0x30010004,
274     0x00100000, 0x10100000, 0x00110000, 0x10110000,
275     0x00100004, 0x10100004, 0x00110004, 0x10110004,
276     0x20100000, 0x30100000, 0x20110000, 0x30110000,
277     0x20100004, 0x30100004, 0x20110004, 0x30110004,
278     0x00001000, 0x10001000, 0x00011000, 0x10011000,
279     0x00001004, 0x10001004, 0x00011004, 0x10011004,
280     0x20001000, 0x30001000, 0x20011000, 0x30011000,
281     0x20001004, 0x30001004, 0x20011004, 0x30011004,
282     0x00101000, 0x10101000, 0x00111000, 0x10111000,
283     0x00101004, 0x10101004, 0x00111004, 0x10111004,
284     0x20101000, 0x30101000, 0x20111000, 0x30111000,
285     0x20101004, 0x30101004, 0x20111004, 0x30111004,
286   },
287   {
288     0x00000000, 0x08000000, 0x00000008, 0x08000008,
289     0x00000400, 0x08000400, 0x00000408, 0x08000408,
290     0x00020000, 0x08020000, 0x00020008, 0x08020008,
291     0x00020400, 0x08020400, 0x00020408, 0x08020408,
292     0x00000001, 0x08000001, 0x00000009, 0x08000009,
293     0x00000401, 0x08000401, 0x00000409, 0x08000409,
294     0x00020001, 0x08020001, 0x00020009, 0x08020009,
295     0x00020401, 0x08020401, 0x00020409, 0x08020409,
296     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
297     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
298     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
299     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
300     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
301     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
302     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
303     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
304   },
305   {
306     0x00000000, 0x00000100, 0x00080000, 0x00080100,
307     0x01000000, 0x01000100, 0x01080000, 0x01080100,
308     0x00000010, 0x00000110, 0x00080010, 0x00080110,
309     0x01000010, 0x01000110, 0x01080010, 0x01080110,
310     0x00200000, 0x00200100, 0x00280000, 0x00280100,
311     0x01200000, 0x01200100, 0x01280000, 0x01280100,
312     0x00200010, 0x00200110, 0x00280010, 0x00280110,
313     0x01200010, 0x01200110, 0x01280010, 0x01280110,
314     0x00000200, 0x00000300, 0x00080200, 0x00080300,
315     0x01000200, 0x01000300, 0x01080200, 0x01080300,
316     0x00000210, 0x00000310, 0x00080210, 0x00080310,
317     0x01000210, 0x01000310, 0x01080210, 0x01080310,
318     0x00200200, 0x00200300, 0x00280200, 0x00280300,
319     0x01200200, 0x01200300, 0x01280200, 0x01280300,
320     0x00200210, 0x00200310, 0x00280210, 0x00280310,
321     0x01200210, 0x01200310, 0x01280210, 0x01280310,
322   },
323   {
324     0x00000000, 0x04000000, 0x00040000, 0x04040000,
325     0x00000002, 0x04000002, 0x00040002, 0x04040002,
326     0x00002000, 0x04002000, 0x00042000, 0x04042000,
327     0x00002002, 0x04002002, 0x00042002, 0x04042002,
328     0x00000020, 0x04000020, 0x00040020, 0x04040020,
329     0x00000022, 0x04000022, 0x00040022, 0x04040022,
330     0x00002020, 0x04002020, 0x00042020, 0x04042020,
331     0x00002022, 0x04002022, 0x00042022, 0x04042022,
332     0x00000800, 0x04000800, 0x00040800, 0x04040800,
333     0x00000802, 0x04000802, 0x00040802, 0x04040802,
334     0x00002800, 0x04002800, 0x00042800, 0x04042800,
335     0x00002802, 0x04002802, 0x00042802, 0x04042802,
336     0x00000820, 0x04000820, 0x00040820, 0x04040820,
337     0x00000822, 0x04000822, 0x00040822, 0x04040822,
338     0x00002820, 0x04002820, 0x00042820, 0x04042820,
339     0x00002822, 0x04002822, 0x00042822, 0x04042822
340   }
341 };
342
343 #define LM_IV_0_IP_RR3 0x2400b807
344 #define LM_IV_1_IP_RR3 0xaa190747
345
346 #define BOX(i,n,S) (S)[(n)][(i)]
347
348 static void _des_crypt_encrypt (u32 iv[2], u32 data[2], u32 Kc[16], u32 Kd[16], __local u32 (*s_SPtrans)[64])
349 {
350   u32 r = data[0];
351   u32 l = data[1];
352
353   #pragma unroll 16
354   for (u32 i = 0; i < 16; i += 2)
355   {
356     u32 u;
357     u32 t;
358
359     u = Kc[i + 0] ^ rotl32 (r, 30u);
360     t = Kd[i + 0] ^ rotl32 (r, 26u);
361
362     l ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
363        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
364        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
365        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
366        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
367        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
368        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
369        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
370
371     u = Kc[i + 1] ^ rotl32 (l, 30u);
372     t = Kd[i + 1] ^ rotl32 (l, 26u);
373
374     r ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
375        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
376        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
377        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
378        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
379        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
380        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
381        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
382   }
383
384   iv[0] = rotl32 (l, 29);
385   iv[1] = rotl32 (r, 29);
386 }
387
388 static void _des_crypt_keysetup (u32 c, u32 d, u32 Kc[16], u32 Kd[16], __local u32 (*s_skb)[64])
389 {
390   u32 tt;
391
392   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
393   HPERM_OP (c,    tt, 2, 0xcccc0000);
394   HPERM_OP (d,    tt, 2, 0xcccc0000);
395   PERM_OP  (d, c, tt, 1, 0x55555555);
396   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
397   PERM_OP  (d, c, tt, 1, 0x55555555);
398
399   d = ((d & 0x000000ff) << 16)
400     | ((d & 0x0000ff00) <<  0)
401     | ((d & 0x00ff0000) >> 16)
402     | ((c & 0xf0000000) >>  4);
403
404   c = c & 0x0fffffff;
405
406   #pragma unroll 16
407   for (u32 i = 0; i < 16; i++)
408   {
409     if ((i < 2) || (i == 8) || (i == 15))
410     {
411       c = ((c >> 1) | (c << 27));
412       d = ((d >> 1) | (d << 27));
413     }
414     else
415     {
416       c = ((c >> 2) | (c << 26));
417       d = ((d >> 2) | (d << 26));
418     }
419
420     c = c & 0x0fffffff;
421     d = d & 0x0fffffff;
422
423     const u32 c00 = (c >>  0) & 0x0000003f;
424     const u32 c06 = (c >>  6) & 0x00383003;
425     const u32 c07 = (c >>  7) & 0x0000003c;
426     const u32 c13 = (c >> 13) & 0x0000060f;
427     const u32 c20 = (c >> 20) & 0x00000001;
428
429     u32 s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
430           | BOX (((c06 >>  0) & 0xff)
431                 |((c07 >>  0) & 0xff), 1, s_skb)
432           | BOX (((c13 >>  0) & 0xff)
433                 |((c06 >>  8) & 0xff), 2, s_skb)
434           | BOX (((c20 >>  0) & 0xff)
435                 |((c13 >>  8) & 0xff)
436                 |((c06 >> 16) & 0xff), 3, s_skb);
437
438     const u32 d00 = (d >>  0) & 0x00003c3f;
439     const u32 d07 = (d >>  7) & 0x00003f03;
440     const u32 d21 = (d >> 21) & 0x0000000f;
441     const u32 d22 = (d >> 22) & 0x00000030;
442
443     u32 t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
444           | BOX (((d07 >>  0) & 0xff)
445                 |((d00 >>  8) & 0xff), 5, s_skb)
446           | BOX (((d07 >>  8) & 0xff), 6, s_skb)
447           | BOX (((d21 >>  0) & 0xff)
448                 |((d22 >>  0) & 0xff), 7, s_skb);
449
450     Kc[i] = ((t << 16) | (s & 0x0000ffff));
451     Kd[i] = ((s >> 16) | (t & 0xffff0000));
452   }
453 }
454
455 static void transform_netntlmv1_key (const u32 w0, const u32 w1, u32 out[2])
456 {
457   const uchar4 t0 = as_uchar4 (w0);
458   const uchar4 t1 = as_uchar4 (w1);
459
460   uchar4 k0;
461   uchar4 k1;
462
463   k0.s0 =                (t0.s0 >> 0);
464   k0.s1 = (t0.s0 << 7) | (t0.s1 >> 1);
465   k0.s2 = (t0.s1 << 6) | (t0.s2 >> 2);
466   k0.s3 = (t0.s2 << 5) | (t0.s3 >> 3);
467   k1.s0 = (t0.s3 << 4) | (t1.s0 >> 4);
468   k1.s1 = (t1.s0 << 3) | (t1.s1 >> 5);
469   k1.s2 = (t1.s1 << 2) | (t1.s2 >> 6);
470   k1.s3 = (t1.s2 << 1);
471
472   out[0] = as_uint (k0);
473   out[1] = as_uint (k1);
474 }
475
476 __kernel void m03000_m04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
477 {
478   /**
479    * modifier
480    */
481
482   const u32 gid = get_global_id (0);
483   const u32 lid = get_local_id (0);
484   const u32 lsz = get_local_size (0);
485
486   /**
487    * base
488    */
489
490   u32 pw_buf[4];
491
492   pw_buf[0] = pws[gid].i[ 0];
493   pw_buf[1] = pws[gid].i[ 1];
494   pw_buf[2] = 0;
495   pw_buf[3] = 0;
496
497   const u32 pw_len = pws[gid].pw_len;
498
499   /**
500    * sbox, kbox
501    */
502
503   __local u32 s_SPtrans[8][64];
504   __local u32 s_skb[8][64];
505
506   for (u32 i = lid; i < 64; i += lsz)
507   {
508     s_SPtrans[0][i] = c_SPtrans[0][i];
509     s_SPtrans[1][i] = c_SPtrans[1][i];
510     s_SPtrans[2][i] = c_SPtrans[2][i];
511     s_SPtrans[3][i] = c_SPtrans[3][i];
512     s_SPtrans[4][i] = c_SPtrans[4][i];
513     s_SPtrans[5][i] = c_SPtrans[5][i];
514     s_SPtrans[6][i] = c_SPtrans[6][i];
515     s_SPtrans[7][i] = c_SPtrans[7][i];
516
517     s_skb[0][i] = c_skb[0][i];
518     s_skb[1][i] = c_skb[1][i];
519     s_skb[2][i] = c_skb[2][i];
520     s_skb[3][i] = c_skb[3][i];
521     s_skb[4][i] = c_skb[4][i];
522     s_skb[5][i] = c_skb[5][i];
523     s_skb[6][i] = c_skb[6][i];
524     s_skb[7][i] = c_skb[7][i];
525   }
526
527   barrier (CLK_LOCAL_MEM_FENCE);
528
529   if (gid >= gid_max) return;
530
531   /**
532    * main
533    */
534
535   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
536   {
537     u32 w0[4];
538
539     w0[0] = pw_buf[0];
540     w0[1] = pw_buf[1];
541     w0[2] = pw_buf[2];
542     w0[3] = pw_buf[3];
543
544     u32 w1[4];
545
546     w1[0] = 0;
547     w1[1] = 0;
548     w1[2] = 0;
549     w1[3] = 0;
550
551     u32 w2[4];
552
553     w2[0] = 0;
554     w2[1] = 0;
555     w2[2] = 0;
556     w2[3] = 0;
557
558     u32 w3[4];
559
560     w3[0] = 0;
561     w3[1] = 0;
562     w3[2] = 0;
563     w3[3] = 0;
564
565     u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
566
567     out_len = (out_len >= 7) ? 7 : out_len;
568
569     u32 key[2];
570
571     transform_netntlmv1_key (w0[0], w0[1], key);
572
573     const u32 c = key[0];
574     const u32 d = key[1];
575
576     u32 Kc[16];
577     u32 Kd[16];
578
579     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
580
581     u32 data[2];
582
583     data[0] = LM_IV_0_IP_RR3;
584     data[1] = LM_IV_1_IP_RR3;
585
586     u32 iv[2];
587
588     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
589
590     const u32 r0 = iv[0];
591     const u32 r1 = iv[1];
592     const u32 r2 = 0;
593     const u32 r3 = 0;
594
595     #include COMPARE_M
596   }
597 }
598
599 __kernel void m03000_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
600 {
601 }
602
603 __kernel void m03000_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
604 {
605 }
606
607 __kernel void m03000_s04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
608 {
609   /**
610    * modifier
611    */
612
613   const u32 gid = get_global_id (0);
614   const u32 lid = get_local_id (0);
615   const u32 lsz = get_local_size (0);
616
617   /**
618    * base
619    */
620
621   u32 pw_buf[4];
622
623   pw_buf[0] = pws[gid].i[ 0];
624   pw_buf[1] = pws[gid].i[ 1];
625   pw_buf[2] = 0;
626   pw_buf[3] = 0;
627
628   const u32 pw_len = pws[gid].pw_len;
629
630   /**
631    * sbox, kbox
632    */
633
634   __local u32 s_SPtrans[8][64];
635   __local u32 s_skb[8][64];
636
637   for (u32 i = lid; i < 64; i += lsz)
638   {
639     s_SPtrans[0][i] = c_SPtrans[0][i];
640     s_SPtrans[1][i] = c_SPtrans[1][i];
641     s_SPtrans[2][i] = c_SPtrans[2][i];
642     s_SPtrans[3][i] = c_SPtrans[3][i];
643     s_SPtrans[4][i] = c_SPtrans[4][i];
644     s_SPtrans[5][i] = c_SPtrans[5][i];
645     s_SPtrans[6][i] = c_SPtrans[6][i];
646     s_SPtrans[7][i] = c_SPtrans[7][i];
647
648     s_skb[0][i] = c_skb[0][i];
649     s_skb[1][i] = c_skb[1][i];
650     s_skb[2][i] = c_skb[2][i];
651     s_skb[3][i] = c_skb[3][i];
652     s_skb[4][i] = c_skb[4][i];
653     s_skb[5][i] = c_skb[5][i];
654     s_skb[6][i] = c_skb[6][i];
655     s_skb[7][i] = c_skb[7][i];
656   }
657
658   barrier (CLK_LOCAL_MEM_FENCE);
659
660   if (gid >= gid_max) return;
661
662   /**
663    * digest
664    */
665
666   const u32 search[4] =
667   {
668     digests_buf[digests_offset].digest_buf[DGST_R0],
669     digests_buf[digests_offset].digest_buf[DGST_R1],
670     digests_buf[digests_offset].digest_buf[DGST_R2],
671     digests_buf[digests_offset].digest_buf[DGST_R3]
672   };
673
674   /**
675    * main
676    */
677
678   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
679   {
680     u32 w0[4];
681
682     w0[0] = pw_buf[0];
683     w0[1] = pw_buf[1];
684     w0[2] = pw_buf[2];
685     w0[3] = pw_buf[3];
686
687     u32 w1[4];
688
689     w1[0] = 0;
690     w1[1] = 0;
691     w1[2] = 0;
692     w1[3] = 0;
693
694     u32 w2[4];
695
696     w2[0] = 0;
697     w2[1] = 0;
698     w2[2] = 0;
699     w2[3] = 0;
700
701     u32 w3[4];
702
703     w3[0] = 0;
704     w3[1] = 0;
705     w3[2] = 0;
706     w3[3] = 0;
707
708     u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
709
710     out_len = (out_len >= 7) ? 7 : out_len;
711
712     u32 key[2];
713
714     transform_netntlmv1_key (w0[0], w0[1], key);
715
716     const u32 c = key[0];
717     const u32 d = key[1];
718
719     u32 Kc[16];
720     u32 Kd[16];
721
722     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
723
724     u32 data[2];
725
726     data[0] = LM_IV_0_IP_RR3;
727     data[1] = LM_IV_1_IP_RR3;
728
729     u32 iv[2];
730
731     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
732
733     const u32 r0 = iv[0];
734     const u32 r1 = iv[1];
735     const u32 r2 = 0;
736     const u32 r3 = 0;
737
738     #include COMPARE_S
739   }
740 }
741
742 __kernel void m03000_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
743 {
744 }
745
746 __kernel void m03000_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
747 {
748 }