Fix -m 1500 multihash and benchmark
[hashcat.git] / OpenCL / m03000_a1.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _DES_
9
10 #define NEW_SIMD_CODE
11
12 #include "include/constants.h"
13 #include "include/kernel_vendor.h"
14
15 #define DGST_R0 0
16 #define DGST_R1 1
17 #define DGST_R2 2
18 #define DGST_R3 3
19
20 #include "include/kernel_functions.c"
21 #include "OpenCL/types_ocl.c"
22 #include "OpenCL/common.c"
23 #include "OpenCL/simd.c"
24
25 #define PERM_OP(a,b,tt,n,m) \
26 {                           \
27   tt = a >> n;              \
28   tt = tt ^ b;              \
29   tt = tt & m;              \
30   b = b ^ tt;               \
31   tt = tt << n;             \
32   a = a ^ tt;               \
33 }
34
35 #define HPERM_OP(a,tt,n,m)  \
36 {                           \
37   tt = a << (16 + n);       \
38   tt = tt ^ a;              \
39   tt = tt & m;              \
40   a  = a ^ tt;              \
41   tt = tt >> (16 + n);      \
42   a  = a ^ tt;              \
43 }
44
45 __constant u32 c_SPtrans[8][64] =
46 {
47   {
48     0x02080800, 0x00080000, 0x02000002, 0x02080802,
49     0x02000000, 0x00080802, 0x00080002, 0x02000002,
50     0x00080802, 0x02080800, 0x02080000, 0x00000802,
51     0x02000802, 0x02000000, 0x00000000, 0x00080002,
52     0x00080000, 0x00000002, 0x02000800, 0x00080800,
53     0x02080802, 0x02080000, 0x00000802, 0x02000800,
54     0x00000002, 0x00000800, 0x00080800, 0x02080002,
55     0x00000800, 0x02000802, 0x02080002, 0x00000000,
56     0x00000000, 0x02080802, 0x02000800, 0x00080002,
57     0x02080800, 0x00080000, 0x00000802, 0x02000800,
58     0x02080002, 0x00000800, 0x00080800, 0x02000002,
59     0x00080802, 0x00000002, 0x02000002, 0x02080000,
60     0x02080802, 0x00080800, 0x02080000, 0x02000802,
61     0x02000000, 0x00000802, 0x00080002, 0x00000000,
62     0x00080000, 0x02000000, 0x02000802, 0x02080800,
63     0x00000002, 0x02080002, 0x00000800, 0x00080802,
64   },
65   {
66     0x40108010, 0x00000000, 0x00108000, 0x40100000,
67     0x40000010, 0x00008010, 0x40008000, 0x00108000,
68     0x00008000, 0x40100010, 0x00000010, 0x40008000,
69     0x00100010, 0x40108000, 0x40100000, 0x00000010,
70     0x00100000, 0x40008010, 0x40100010, 0x00008000,
71     0x00108010, 0x40000000, 0x00000000, 0x00100010,
72     0x40008010, 0x00108010, 0x40108000, 0x40000010,
73     0x40000000, 0x00100000, 0x00008010, 0x40108010,
74     0x00100010, 0x40108000, 0x40008000, 0x00108010,
75     0x40108010, 0x00100010, 0x40000010, 0x00000000,
76     0x40000000, 0x00008010, 0x00100000, 0x40100010,
77     0x00008000, 0x40000000, 0x00108010, 0x40008010,
78     0x40108000, 0x00008000, 0x00000000, 0x40000010,
79     0x00000010, 0x40108010, 0x00108000, 0x40100000,
80     0x40100010, 0x00100000, 0x00008010, 0x40008000,
81     0x40008010, 0x00000010, 0x40100000, 0x00108000,
82   },
83   {
84     0x04000001, 0x04040100, 0x00000100, 0x04000101,
85     0x00040001, 0x04000000, 0x04000101, 0x00040100,
86     0x04000100, 0x00040000, 0x04040000, 0x00000001,
87     0x04040101, 0x00000101, 0x00000001, 0x04040001,
88     0x00000000, 0x00040001, 0x04040100, 0x00000100,
89     0x00000101, 0x04040101, 0x00040000, 0x04000001,
90     0x04040001, 0x04000100, 0x00040101, 0x04040000,
91     0x00040100, 0x00000000, 0x04000000, 0x00040101,
92     0x04040100, 0x00000100, 0x00000001, 0x00040000,
93     0x00000101, 0x00040001, 0x04040000, 0x04000101,
94     0x00000000, 0x04040100, 0x00040100, 0x04040001,
95     0x00040001, 0x04000000, 0x04040101, 0x00000001,
96     0x00040101, 0x04000001, 0x04000000, 0x04040101,
97     0x00040000, 0x04000100, 0x04000101, 0x00040100,
98     0x04000100, 0x00000000, 0x04040001, 0x00000101,
99     0x04000001, 0x00040101, 0x00000100, 0x04040000,
100   },
101   {
102     0x00401008, 0x10001000, 0x00000008, 0x10401008,
103     0x00000000, 0x10400000, 0x10001008, 0x00400008,
104     0x10401000, 0x10000008, 0x10000000, 0x00001008,
105     0x10000008, 0x00401008, 0x00400000, 0x10000000,
106     0x10400008, 0x00401000, 0x00001000, 0x00000008,
107     0x00401000, 0x10001008, 0x10400000, 0x00001000,
108     0x00001008, 0x00000000, 0x00400008, 0x10401000,
109     0x10001000, 0x10400008, 0x10401008, 0x00400000,
110     0x10400008, 0x00001008, 0x00400000, 0x10000008,
111     0x00401000, 0x10001000, 0x00000008, 0x10400000,
112     0x10001008, 0x00000000, 0x00001000, 0x00400008,
113     0x00000000, 0x10400008, 0x10401000, 0x00001000,
114     0x10000000, 0x10401008, 0x00401008, 0x00400000,
115     0x10401008, 0x00000008, 0x10001000, 0x00401008,
116     0x00400008, 0x00401000, 0x10400000, 0x10001008,
117     0x00001008, 0x10000000, 0x10000008, 0x10401000,
118   },
119   {
120     0x08000000, 0x00010000, 0x00000400, 0x08010420,
121     0x08010020, 0x08000400, 0x00010420, 0x08010000,
122     0x00010000, 0x00000020, 0x08000020, 0x00010400,
123     0x08000420, 0x08010020, 0x08010400, 0x00000000,
124     0x00010400, 0x08000000, 0x00010020, 0x00000420,
125     0x08000400, 0x00010420, 0x00000000, 0x08000020,
126     0x00000020, 0x08000420, 0x08010420, 0x00010020,
127     0x08010000, 0x00000400, 0x00000420, 0x08010400,
128     0x08010400, 0x08000420, 0x00010020, 0x08010000,
129     0x00010000, 0x00000020, 0x08000020, 0x08000400,
130     0x08000000, 0x00010400, 0x08010420, 0x00000000,
131     0x00010420, 0x08000000, 0x00000400, 0x00010020,
132     0x08000420, 0x00000400, 0x00000000, 0x08010420,
133     0x08010020, 0x08010400, 0x00000420, 0x00010000,
134     0x00010400, 0x08010020, 0x08000400, 0x00000420,
135     0x00000020, 0x00010420, 0x08010000, 0x08000020,
136   },
137   {
138     0x80000040, 0x00200040, 0x00000000, 0x80202000,
139     0x00200040, 0x00002000, 0x80002040, 0x00200000,
140     0x00002040, 0x80202040, 0x00202000, 0x80000000,
141     0x80002000, 0x80000040, 0x80200000, 0x00202040,
142     0x00200000, 0x80002040, 0x80200040, 0x00000000,
143     0x00002000, 0x00000040, 0x80202000, 0x80200040,
144     0x80202040, 0x80200000, 0x80000000, 0x00002040,
145     0x00000040, 0x00202000, 0x00202040, 0x80002000,
146     0x00002040, 0x80000000, 0x80002000, 0x00202040,
147     0x80202000, 0x00200040, 0x00000000, 0x80002000,
148     0x80000000, 0x00002000, 0x80200040, 0x00200000,
149     0x00200040, 0x80202040, 0x00202000, 0x00000040,
150     0x80202040, 0x00202000, 0x00200000, 0x80002040,
151     0x80000040, 0x80200000, 0x00202040, 0x00000000,
152     0x00002000, 0x80000040, 0x80002040, 0x80202000,
153     0x80200000, 0x00002040, 0x00000040, 0x80200040,
154   },
155   {
156     0x00004000, 0x00000200, 0x01000200, 0x01000004,
157     0x01004204, 0x00004004, 0x00004200, 0x00000000,
158     0x01000000, 0x01000204, 0x00000204, 0x01004000,
159     0x00000004, 0x01004200, 0x01004000, 0x00000204,
160     0x01000204, 0x00004000, 0x00004004, 0x01004204,
161     0x00000000, 0x01000200, 0x01000004, 0x00004200,
162     0x01004004, 0x00004204, 0x01004200, 0x00000004,
163     0x00004204, 0x01004004, 0x00000200, 0x01000000,
164     0x00004204, 0x01004000, 0x01004004, 0x00000204,
165     0x00004000, 0x00000200, 0x01000000, 0x01004004,
166     0x01000204, 0x00004204, 0x00004200, 0x00000000,
167     0x00000200, 0x01000004, 0x00000004, 0x01000200,
168     0x00000000, 0x01000204, 0x01000200, 0x00004200,
169     0x00000204, 0x00004000, 0x01004204, 0x01000000,
170     0x01004200, 0x00000004, 0x00004004, 0x01004204,
171     0x01000004, 0x01004200, 0x01004000, 0x00004004,
172   },
173   {
174     0x20800080, 0x20820000, 0x00020080, 0x00000000,
175     0x20020000, 0x00800080, 0x20800000, 0x20820080,
176     0x00000080, 0x20000000, 0x00820000, 0x00020080,
177     0x00820080, 0x20020080, 0x20000080, 0x20800000,
178     0x00020000, 0x00820080, 0x00800080, 0x20020000,
179     0x20820080, 0x20000080, 0x00000000, 0x00820000,
180     0x20000000, 0x00800000, 0x20020080, 0x20800080,
181     0x00800000, 0x00020000, 0x20820000, 0x00000080,
182     0x00800000, 0x00020000, 0x20000080, 0x20820080,
183     0x00020080, 0x20000000, 0x00000000, 0x00820000,
184     0x20800080, 0x20020080, 0x20020000, 0x00800080,
185     0x20820000, 0x00000080, 0x00800080, 0x20020000,
186     0x20820080, 0x00800000, 0x20800000, 0x20000080,
187     0x00820000, 0x00020080, 0x20020080, 0x20800000,
188     0x00000080, 0x20820000, 0x00820080, 0x00000000,
189     0x20000000, 0x20800080, 0x00020000, 0x00820080,
190   }
191 };
192
193 __constant u32 c_skb[8][64] =
194 {
195   {
196     0x00000000, 0x00000010, 0x20000000, 0x20000010,
197     0x00010000, 0x00010010, 0x20010000, 0x20010010,
198     0x00000800, 0x00000810, 0x20000800, 0x20000810,
199     0x00010800, 0x00010810, 0x20010800, 0x20010810,
200     0x00000020, 0x00000030, 0x20000020, 0x20000030,
201     0x00010020, 0x00010030, 0x20010020, 0x20010030,
202     0x00000820, 0x00000830, 0x20000820, 0x20000830,
203     0x00010820, 0x00010830, 0x20010820, 0x20010830,
204     0x00080000, 0x00080010, 0x20080000, 0x20080010,
205     0x00090000, 0x00090010, 0x20090000, 0x20090010,
206     0x00080800, 0x00080810, 0x20080800, 0x20080810,
207     0x00090800, 0x00090810, 0x20090800, 0x20090810,
208     0x00080020, 0x00080030, 0x20080020, 0x20080030,
209     0x00090020, 0x00090030, 0x20090020, 0x20090030,
210     0x00080820, 0x00080830, 0x20080820, 0x20080830,
211     0x00090820, 0x00090830, 0x20090820, 0x20090830,
212   },
213   {
214     0x00000000, 0x02000000, 0x00002000, 0x02002000,
215     0x00200000, 0x02200000, 0x00202000, 0x02202000,
216     0x00000004, 0x02000004, 0x00002004, 0x02002004,
217     0x00200004, 0x02200004, 0x00202004, 0x02202004,
218     0x00000400, 0x02000400, 0x00002400, 0x02002400,
219     0x00200400, 0x02200400, 0x00202400, 0x02202400,
220     0x00000404, 0x02000404, 0x00002404, 0x02002404,
221     0x00200404, 0x02200404, 0x00202404, 0x02202404,
222     0x10000000, 0x12000000, 0x10002000, 0x12002000,
223     0x10200000, 0x12200000, 0x10202000, 0x12202000,
224     0x10000004, 0x12000004, 0x10002004, 0x12002004,
225     0x10200004, 0x12200004, 0x10202004, 0x12202004,
226     0x10000400, 0x12000400, 0x10002400, 0x12002400,
227     0x10200400, 0x12200400, 0x10202400, 0x12202400,
228     0x10000404, 0x12000404, 0x10002404, 0x12002404,
229     0x10200404, 0x12200404, 0x10202404, 0x12202404,
230   },
231   {
232     0x00000000, 0x00000001, 0x00040000, 0x00040001,
233     0x01000000, 0x01000001, 0x01040000, 0x01040001,
234     0x00000002, 0x00000003, 0x00040002, 0x00040003,
235     0x01000002, 0x01000003, 0x01040002, 0x01040003,
236     0x00000200, 0x00000201, 0x00040200, 0x00040201,
237     0x01000200, 0x01000201, 0x01040200, 0x01040201,
238     0x00000202, 0x00000203, 0x00040202, 0x00040203,
239     0x01000202, 0x01000203, 0x01040202, 0x01040203,
240     0x08000000, 0x08000001, 0x08040000, 0x08040001,
241     0x09000000, 0x09000001, 0x09040000, 0x09040001,
242     0x08000002, 0x08000003, 0x08040002, 0x08040003,
243     0x09000002, 0x09000003, 0x09040002, 0x09040003,
244     0x08000200, 0x08000201, 0x08040200, 0x08040201,
245     0x09000200, 0x09000201, 0x09040200, 0x09040201,
246     0x08000202, 0x08000203, 0x08040202, 0x08040203,
247     0x09000202, 0x09000203, 0x09040202, 0x09040203,
248   },
249   {
250     0x00000000, 0x00100000, 0x00000100, 0x00100100,
251     0x00000008, 0x00100008, 0x00000108, 0x00100108,
252     0x00001000, 0x00101000, 0x00001100, 0x00101100,
253     0x00001008, 0x00101008, 0x00001108, 0x00101108,
254     0x04000000, 0x04100000, 0x04000100, 0x04100100,
255     0x04000008, 0x04100008, 0x04000108, 0x04100108,
256     0x04001000, 0x04101000, 0x04001100, 0x04101100,
257     0x04001008, 0x04101008, 0x04001108, 0x04101108,
258     0x00020000, 0x00120000, 0x00020100, 0x00120100,
259     0x00020008, 0x00120008, 0x00020108, 0x00120108,
260     0x00021000, 0x00121000, 0x00021100, 0x00121100,
261     0x00021008, 0x00121008, 0x00021108, 0x00121108,
262     0x04020000, 0x04120000, 0x04020100, 0x04120100,
263     0x04020008, 0x04120008, 0x04020108, 0x04120108,
264     0x04021000, 0x04121000, 0x04021100, 0x04121100,
265     0x04021008, 0x04121008, 0x04021108, 0x04121108,
266   },
267   {
268     0x00000000, 0x10000000, 0x00010000, 0x10010000,
269     0x00000004, 0x10000004, 0x00010004, 0x10010004,
270     0x20000000, 0x30000000, 0x20010000, 0x30010000,
271     0x20000004, 0x30000004, 0x20010004, 0x30010004,
272     0x00100000, 0x10100000, 0x00110000, 0x10110000,
273     0x00100004, 0x10100004, 0x00110004, 0x10110004,
274     0x20100000, 0x30100000, 0x20110000, 0x30110000,
275     0x20100004, 0x30100004, 0x20110004, 0x30110004,
276     0x00001000, 0x10001000, 0x00011000, 0x10011000,
277     0x00001004, 0x10001004, 0x00011004, 0x10011004,
278     0x20001000, 0x30001000, 0x20011000, 0x30011000,
279     0x20001004, 0x30001004, 0x20011004, 0x30011004,
280     0x00101000, 0x10101000, 0x00111000, 0x10111000,
281     0x00101004, 0x10101004, 0x00111004, 0x10111004,
282     0x20101000, 0x30101000, 0x20111000, 0x30111000,
283     0x20101004, 0x30101004, 0x20111004, 0x30111004,
284   },
285   {
286     0x00000000, 0x08000000, 0x00000008, 0x08000008,
287     0x00000400, 0x08000400, 0x00000408, 0x08000408,
288     0x00020000, 0x08020000, 0x00020008, 0x08020008,
289     0x00020400, 0x08020400, 0x00020408, 0x08020408,
290     0x00000001, 0x08000001, 0x00000009, 0x08000009,
291     0x00000401, 0x08000401, 0x00000409, 0x08000409,
292     0x00020001, 0x08020001, 0x00020009, 0x08020009,
293     0x00020401, 0x08020401, 0x00020409, 0x08020409,
294     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
295     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
296     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
297     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
298     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
299     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
300     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
301     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
302   },
303   {
304     0x00000000, 0x00000100, 0x00080000, 0x00080100,
305     0x01000000, 0x01000100, 0x01080000, 0x01080100,
306     0x00000010, 0x00000110, 0x00080010, 0x00080110,
307     0x01000010, 0x01000110, 0x01080010, 0x01080110,
308     0x00200000, 0x00200100, 0x00280000, 0x00280100,
309     0x01200000, 0x01200100, 0x01280000, 0x01280100,
310     0x00200010, 0x00200110, 0x00280010, 0x00280110,
311     0x01200010, 0x01200110, 0x01280010, 0x01280110,
312     0x00000200, 0x00000300, 0x00080200, 0x00080300,
313     0x01000200, 0x01000300, 0x01080200, 0x01080300,
314     0x00000210, 0x00000310, 0x00080210, 0x00080310,
315     0x01000210, 0x01000310, 0x01080210, 0x01080310,
316     0x00200200, 0x00200300, 0x00280200, 0x00280300,
317     0x01200200, 0x01200300, 0x01280200, 0x01280300,
318     0x00200210, 0x00200310, 0x00280210, 0x00280310,
319     0x01200210, 0x01200310, 0x01280210, 0x01280310,
320   },
321   {
322     0x00000000, 0x04000000, 0x00040000, 0x04040000,
323     0x00000002, 0x04000002, 0x00040002, 0x04040002,
324     0x00002000, 0x04002000, 0x00042000, 0x04042000,
325     0x00002002, 0x04002002, 0x00042002, 0x04042002,
326     0x00000020, 0x04000020, 0x00040020, 0x04040020,
327     0x00000022, 0x04000022, 0x00040022, 0x04040022,
328     0x00002020, 0x04002020, 0x00042020, 0x04042020,
329     0x00002022, 0x04002022, 0x00042022, 0x04042022,
330     0x00000800, 0x04000800, 0x00040800, 0x04040800,
331     0x00000802, 0x04000802, 0x00040802, 0x04040802,
332     0x00002800, 0x04002800, 0x00042800, 0x04042800,
333     0x00002802, 0x04002802, 0x00042802, 0x04042802,
334     0x00000820, 0x04000820, 0x00040820, 0x04040820,
335     0x00000822, 0x04000822, 0x00040822, 0x04040822,
336     0x00002820, 0x04002820, 0x00042820, 0x04042820,
337     0x00002822, 0x04002822, 0x00042822, 0x04042822
338   }
339 };
340
341 #define LM_IV_0_IP_RR3 0x2400b807
342 #define LM_IV_1_IP_RR3 0xaa190747
343
344 #if   VECT_SIZE == 1
345 #define BOX(i,n,S) (S)[(n)][(i)]
346 #elif VECT_SIZE == 2
347 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1])
348 #elif VECT_SIZE == 4
349 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3])
350 #elif VECT_SIZE == 8
351 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7])
352 #elif VECT_SIZE == 16
353 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7], (S)[(n)][(i).s8], (S)[(n)][(i).s9], (S)[(n)][(i).sa], (S)[(n)][(i).sb], (S)[(n)][(i).sc], (S)[(n)][(i).sd], (S)[(n)][(i).se], (S)[(n)][(i).sf])
354 #endif
355
356 void _des_crypt_encrypt (u32x iv[2], u32x data[2], u32x Kc[16], u32x Kd[16], __local u32 (*s_SPtrans)[64])
357 {
358   u32x r = data[0];
359   u32x l = data[1];
360
361   #pragma unroll 16
362   for (u32 i = 0; i < 16; i += 2)
363   {
364     u32x u;
365     u32x t;
366
367     u = Kc[i + 0] ^ rotl32 (r, 30u);
368     t = Kd[i + 0] ^ rotl32 (r, 26u);
369
370     l ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
371        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
372        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
373        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
374        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
375        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
376        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
377        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
378
379     u = Kc[i + 1] ^ rotl32 (l, 30u);
380     t = Kd[i + 1] ^ rotl32 (l, 26u);
381
382     r ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
383        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
384        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
385        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
386        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
387        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
388        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
389        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
390   }
391
392   iv[0] = rotl32 (l, 29);
393   iv[1] = rotl32 (r, 29);
394 }
395
396 void _des_crypt_keysetup (u32x c, u32x d, u32x Kc[16], u32x Kd[16], __local u32 (*s_skb)[64])
397 {
398   u32x tt;
399
400   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
401   HPERM_OP (c,    tt, 2, 0xcccc0000);
402   HPERM_OP (d,    tt, 2, 0xcccc0000);
403   PERM_OP  (d, c, tt, 1, 0x55555555);
404   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
405   PERM_OP  (d, c, tt, 1, 0x55555555);
406
407   d = ((d & 0x000000ff) << 16)
408     | ((d & 0x0000ff00) <<  0)
409     | ((d & 0x00ff0000) >> 16)
410     | ((c & 0xf0000000) >>  4);
411
412   c = c & 0x0fffffff;
413
414   #pragma unroll 16
415   for (u32 i = 0; i < 16; i++)
416   {
417     if ((i < 2) || (i == 8) || (i == 15))
418     {
419       c = ((c >> 1) | (c << 27));
420       d = ((d >> 1) | (d << 27));
421     }
422     else
423     {
424       c = ((c >> 2) | (c << 26));
425       d = ((d >> 2) | (d << 26));
426     }
427
428     c = c & 0x0fffffff;
429     d = d & 0x0fffffff;
430
431     const u32x c00 = (c >>  0) & 0x0000003f;
432     const u32x c06 = (c >>  6) & 0x00383003;
433     const u32x c07 = (c >>  7) & 0x0000003c;
434     const u32x c13 = (c >> 13) & 0x0000060f;
435     const u32x c20 = (c >> 20) & 0x00000001;
436
437     u32x s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
438            | BOX (((c06 >>  0) & 0xff)
439                  |((c07 >>  0) & 0xff), 1, s_skb)
440            | BOX (((c13 >>  0) & 0xff)
441                  |((c06 >>  8) & 0xff), 2, s_skb)
442            | BOX (((c20 >>  0) & 0xff)
443                  |((c13 >>  8) & 0xff)
444                  |((c06 >> 16) & 0xff), 3, s_skb);
445
446     const u32x d00 = (d >>  0) & 0x00003c3f;
447     const u32x d07 = (d >>  7) & 0x00003f03;
448     const u32x d21 = (d >> 21) & 0x0000000f;
449     const u32x d22 = (d >> 22) & 0x00000030;
450
451     u32x t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
452            | BOX (((d07 >>  0) & 0xff)
453                  |((d00 >>  8) & 0xff), 5, s_skb)
454            | BOX (((d07 >>  8) & 0xff), 6, s_skb)
455            | BOX (((d21 >>  0) & 0xff)
456                  |((d22 >>  0) & 0xff), 7, s_skb);
457
458     Kc[i] = ((t << 16) | (s & 0x0000ffff));
459     Kd[i] = ((s >> 16) | (t & 0xffff0000));
460   }
461 }
462
463 void transform_netntlmv1_key (const u32x w0, const u32x w1, u32x out[2])
464 {
465   u32x t[8];
466
467   t[0] = (w0 >>  0) & 0xff;
468   t[1] = (w0 >>  8) & 0xff;
469   t[2] = (w0 >> 16) & 0xff;
470   t[3] = (w0 >> 24) & 0xff;
471   t[4] = (w1 >>  0) & 0xff;
472   t[5] = (w1 >>  8) & 0xff;
473   t[6] = (w1 >> 16) & 0xff;
474   t[7] = (w1 >> 24) & 0xff;
475
476   u32x k[8];
477
478   k[0] =               (t[0] >> 0);
479   k[1] = (t[0] << 7) | (t[1] >> 1);
480   k[2] = (t[1] << 6) | (t[2] >> 2);
481   k[3] = (t[2] << 5) | (t[3] >> 3);
482   k[4] = (t[3] << 4) | (t[4] >> 4);
483   k[5] = (t[4] << 3) | (t[5] >> 5);
484   k[6] = (t[5] << 2) | (t[6] >> 6);
485   k[7] = (t[6] << 1);
486
487   out[0] = ((k[0] & 0xff) <<  0)
488          | ((k[1] & 0xff) <<  8)
489          | ((k[2] & 0xff) << 16)
490          | ((k[3] & 0xff) << 24);
491
492   out[1] = ((k[4] & 0xff) <<  0)
493          | ((k[5] & 0xff) <<  8)
494          | ((k[6] & 0xff) << 16)
495          | ((k[7] & 0xff) << 24);
496 }
497
498 __kernel void m03000_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
499 {
500   /**
501    * modifier
502    */
503
504   const u32 gid = get_global_id (0);
505   const u32 lid = get_local_id (0);
506   const u32 lsz = get_local_size (0);
507
508   /**
509    * sbox, kbox
510    */
511
512   __local u32 s_SPtrans[8][64];
513   __local u32 s_skb[8][64];
514
515   for (u32 i = lid; i < 64; i += lsz)
516   {
517     s_SPtrans[0][i] = c_SPtrans[0][i];
518     s_SPtrans[1][i] = c_SPtrans[1][i];
519     s_SPtrans[2][i] = c_SPtrans[2][i];
520     s_SPtrans[3][i] = c_SPtrans[3][i];
521     s_SPtrans[4][i] = c_SPtrans[4][i];
522     s_SPtrans[5][i] = c_SPtrans[5][i];
523     s_SPtrans[6][i] = c_SPtrans[6][i];
524     s_SPtrans[7][i] = c_SPtrans[7][i];
525
526     s_skb[0][i] = c_skb[0][i];
527     s_skb[1][i] = c_skb[1][i];
528     s_skb[2][i] = c_skb[2][i];
529     s_skb[3][i] = c_skb[3][i];
530     s_skb[4][i] = c_skb[4][i];
531     s_skb[5][i] = c_skb[5][i];
532     s_skb[6][i] = c_skb[6][i];
533     s_skb[7][i] = c_skb[7][i];
534   }
535
536   barrier (CLK_LOCAL_MEM_FENCE);
537
538   if (gid >= gid_max) return;
539
540   /**
541    * base
542    */
543
544   u32 pw_buf0[4];
545   u32 pw_buf1[4];
546
547   pw_buf0[0] = pws[gid].i[0];
548   pw_buf0[1] = pws[gid].i[1];
549   pw_buf0[2] = pws[gid].i[2];
550   pw_buf0[3] = pws[gid].i[3];
551   pw_buf1[0] = pws[gid].i[4];
552   pw_buf1[1] = pws[gid].i[5];
553   pw_buf1[2] = pws[gid].i[6];
554   pw_buf1[3] = pws[gid].i[7];
555
556   const u32 pw_l_len = pws[gid].pw_len;
557
558   /**
559    * loop
560    */
561
562   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
563   {
564     const u32x pw_r_len = pwlenx_create_combt (combs_buf, il_pos);
565
566     const u32x pw_len = pw_l_len + pw_r_len;
567
568     /**
569      * concat password candidate
570      */
571
572     u32x wordl0[4] = { 0 };
573     u32x wordl1[4] = { 0 };
574     u32x wordl2[4] = { 0 };
575     u32x wordl3[4] = { 0 };
576
577     wordl0[0] = pw_buf0[0];
578     wordl0[1] = pw_buf0[1];
579     wordl0[2] = pw_buf0[2];
580     wordl0[3] = pw_buf0[3];
581     wordl1[0] = pw_buf1[0];
582     wordl1[1] = pw_buf1[1];
583     wordl1[2] = pw_buf1[2];
584     wordl1[3] = pw_buf1[3];
585
586     u32x wordr0[4] = { 0 };
587     u32x wordr1[4] = { 0 };
588     u32x wordr2[4] = { 0 };
589     u32x wordr3[4] = { 0 };
590
591     wordr0[0] = ix_create_combt (combs_buf, il_pos, 0);
592     wordr0[1] = ix_create_combt (combs_buf, il_pos, 1);
593     wordr0[2] = ix_create_combt (combs_buf, il_pos, 2);
594     wordr0[3] = ix_create_combt (combs_buf, il_pos, 3);
595     wordr1[0] = ix_create_combt (combs_buf, il_pos, 4);
596     wordr1[1] = ix_create_combt (combs_buf, il_pos, 5);
597     wordr1[2] = ix_create_combt (combs_buf, il_pos, 6);
598     wordr1[3] = ix_create_combt (combs_buf, il_pos, 7);
599
600     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
601     {
602       switch_buffer_by_offset_le_VV (wordr0, wordr1, wordr2, wordr3, pw_l_len);
603     }
604     else
605     {
606       switch_buffer_by_offset_le_VV (wordl0, wordl1, wordl2, wordl3, pw_r_len);
607     }
608
609     u32x w0[4];
610     u32x w1[4];
611     u32x w2[4];
612     u32x w3[4];
613
614     w0[0] = wordl0[0] | wordr0[0];
615     w0[1] = wordl0[1] | wordr0[1];
616     w0[2] = wordl0[2] | wordr0[2];
617     w0[3] = wordl0[3] | wordr0[3];
618     w1[0] = wordl1[0] | wordr1[0];
619     w1[1] = wordl1[1] | wordr1[1];
620     w1[2] = wordl1[2] | wordr1[2];
621     w1[3] = wordl1[3] | wordr1[3];
622     w2[0] = wordl2[0] | wordr2[0];
623     w2[1] = wordl2[1] | wordr2[1];
624     w2[2] = wordl2[2] | wordr2[2];
625     w2[3] = wordl2[3] | wordr2[3];
626     w3[0] = wordl3[0] | wordr3[0];
627     w3[1] = wordl3[1] | wordr3[1];
628     w3[2] = wordl3[2] | wordr3[2];
629     w3[3] = wordl3[3] | wordr3[3];
630
631     /**
632      * DES
633      */
634
635     u32x key[2];
636
637     transform_netntlmv1_key (w0[0], w0[1], key);
638
639     const u32x c = key[0];
640     const u32x d = key[1];
641
642     u32x Kc[16];
643     u32x Kd[16];
644
645     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
646
647     u32x data[2];
648
649     data[0] = LM_IV_0_IP_RR3;
650     data[1] = LM_IV_1_IP_RR3;
651
652     u32x iv[2];
653
654     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
655
656     u32x z = 0;
657
658     COMPARE_M_SIMD (iv[0], iv[1], z, z);
659   }
660 }
661
662 __kernel void m03000_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
663 {
664 }
665
666 __kernel void m03000_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
667 {
668 }
669
670 __kernel void m03000_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
671 {
672   /**
673    * modifier
674    */
675
676   const u32 gid = get_global_id (0);
677   const u32 lid = get_local_id (0);
678   const u32 lsz = get_local_size (0);
679
680   /**
681    * sbox, kbox
682    */
683
684   __local u32 s_SPtrans[8][64];
685   __local u32 s_skb[8][64];
686
687   for (u32 i = lid; i < 64; i += lsz)
688   {
689     s_SPtrans[0][i] = c_SPtrans[0][i];
690     s_SPtrans[1][i] = c_SPtrans[1][i];
691     s_SPtrans[2][i] = c_SPtrans[2][i];
692     s_SPtrans[3][i] = c_SPtrans[3][i];
693     s_SPtrans[4][i] = c_SPtrans[4][i];
694     s_SPtrans[5][i] = c_SPtrans[5][i];
695     s_SPtrans[6][i] = c_SPtrans[6][i];
696     s_SPtrans[7][i] = c_SPtrans[7][i];
697
698     s_skb[0][i] = c_skb[0][i];
699     s_skb[1][i] = c_skb[1][i];
700     s_skb[2][i] = c_skb[2][i];
701     s_skb[3][i] = c_skb[3][i];
702     s_skb[4][i] = c_skb[4][i];
703     s_skb[5][i] = c_skb[5][i];
704     s_skb[6][i] = c_skb[6][i];
705     s_skb[7][i] = c_skb[7][i];
706   }
707
708   barrier (CLK_LOCAL_MEM_FENCE);
709
710   if (gid >= gid_max) return;
711
712   /**
713    * base
714    */
715
716   u32 pw_buf0[4];
717   u32 pw_buf1[4];
718
719   pw_buf0[0] = pws[gid].i[0];
720   pw_buf0[1] = pws[gid].i[1];
721   pw_buf0[2] = pws[gid].i[2];
722   pw_buf0[3] = pws[gid].i[3];
723   pw_buf1[0] = pws[gid].i[4];
724   pw_buf1[1] = pws[gid].i[5];
725   pw_buf1[2] = pws[gid].i[6];
726   pw_buf1[3] = pws[gid].i[7];
727
728   const u32 pw_l_len = pws[gid].pw_len;
729
730   /**
731    * digest
732    */
733
734   const u32 search[4] =
735   {
736     digests_buf[digests_offset].digest_buf[DGST_R0],
737     digests_buf[digests_offset].digest_buf[DGST_R1],
738     0,
739     0
740   };
741
742   /**
743    * loop
744    */
745
746   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
747   {
748     const u32x pw_r_len = pwlenx_create_combt (combs_buf, il_pos);
749
750     const u32x pw_len = pw_l_len + pw_r_len;
751
752     /**
753      * concat password candidate
754      */
755
756     u32x wordl0[4] = { 0 };
757     u32x wordl1[4] = { 0 };
758     u32x wordl2[4] = { 0 };
759     u32x wordl3[4] = { 0 };
760
761     wordl0[0] = pw_buf0[0];
762     wordl0[1] = pw_buf0[1];
763     wordl0[2] = pw_buf0[2];
764     wordl0[3] = pw_buf0[3];
765     wordl1[0] = pw_buf1[0];
766     wordl1[1] = pw_buf1[1];
767     wordl1[2] = pw_buf1[2];
768     wordl1[3] = pw_buf1[3];
769
770     u32x wordr0[4] = { 0 };
771     u32x wordr1[4] = { 0 };
772     u32x wordr2[4] = { 0 };
773     u32x wordr3[4] = { 0 };
774
775     wordr0[0] = ix_create_combt (combs_buf, il_pos, 0);
776     wordr0[1] = ix_create_combt (combs_buf, il_pos, 1);
777     wordr0[2] = ix_create_combt (combs_buf, il_pos, 2);
778     wordr0[3] = ix_create_combt (combs_buf, il_pos, 3);
779     wordr1[0] = ix_create_combt (combs_buf, il_pos, 4);
780     wordr1[1] = ix_create_combt (combs_buf, il_pos, 5);
781     wordr1[2] = ix_create_combt (combs_buf, il_pos, 6);
782     wordr1[3] = ix_create_combt (combs_buf, il_pos, 7);
783
784     if (combs_mode == COMBINATOR_MODE_BASE_LEFT)
785     {
786       switch_buffer_by_offset_le_VV (wordr0, wordr1, wordr2, wordr3, pw_l_len);
787     }
788     else
789     {
790       switch_buffer_by_offset_le_VV (wordl0, wordl1, wordl2, wordl3, pw_r_len);
791     }
792
793     u32x w0[4];
794     u32x w1[4];
795     u32x w2[4];
796     u32x w3[4];
797
798     w0[0] = wordl0[0] | wordr0[0];
799     w0[1] = wordl0[1] | wordr0[1];
800     w0[2] = wordl0[2] | wordr0[2];
801     w0[3] = wordl0[3] | wordr0[3];
802     w1[0] = wordl1[0] | wordr1[0];
803     w1[1] = wordl1[1] | wordr1[1];
804     w1[2] = wordl1[2] | wordr1[2];
805     w1[3] = wordl1[3] | wordr1[3];
806     w2[0] = wordl2[0] | wordr2[0];
807     w2[1] = wordl2[1] | wordr2[1];
808     w2[2] = wordl2[2] | wordr2[2];
809     w2[3] = wordl2[3] | wordr2[3];
810     w3[0] = wordl3[0] | wordr3[0];
811     w3[1] = wordl3[1] | wordr3[1];
812     w3[2] = wordl3[2] | wordr3[2];
813     w3[3] = wordl3[3] | wordr3[3];
814
815     /**
816      * DES
817      */
818
819     u32x key[2];
820
821     transform_netntlmv1_key (w0[0], w0[1], key);
822
823     const u32x c = key[0];
824     const u32x d = key[1];
825
826     u32x Kc[16];
827     u32x Kd[16];
828
829     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
830
831     u32x data[2];
832
833     data[0] = LM_IV_0_IP_RR3;
834     data[1] = LM_IV_1_IP_RR3;
835
836     u32x iv[2];
837
838     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
839
840     u32x z = 0;
841
842     COMPARE_S_SIMD (iv[0], iv[1], z, z);
843   }
844 }
845
846 __kernel void m03000_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
847 {
848 }
849
850 __kernel void m03000_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
851 {
852 }