5be3695a6f59bfa3aa68feaecf94d6229d4e6e35
[hashcat.git] / OpenCL / m03000_a0.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *               magnum <john.magnum@hushmail.com>
5  *
6  * License.....: MIT
7  */
8
9 #define _DES_
10
11 #define NEW_SIMD_CODE
12
13 #include "include/constants.h"
14 #include "include/kernel_vendor.h"
15
16 #define DGST_R0 0
17 #define DGST_R1 1
18 #define DGST_R2 2
19 #define DGST_R3 3
20
21 #include "include/kernel_functions.c"
22 #include "OpenCL/types_ocl.c"
23 #include "OpenCL/common.c"
24 #include "include/rp_kernel.h"
25 #include "OpenCL/rp.c"
26 #include "OpenCL/simd.c"
27
28 #define PERM_OP(a,b,tt,n,m) \
29 {                           \
30   tt = a >> n;              \
31   tt = tt ^ b;              \
32   tt = tt & m;              \
33   b = b ^ tt;               \
34   tt = tt << n;             \
35   a = a ^ tt;               \
36 }
37
38 #define HPERM_OP(a,tt,n,m)  \
39 {                           \
40   tt = a << (16 + n);       \
41   tt = tt ^ a;              \
42   tt = tt & m;              \
43   a  = a ^ tt;              \
44   tt = tt >> (16 + n);      \
45   a  = a ^ tt;              \
46 }
47
48 __constant u32 c_SPtrans[8][64] =
49 {
50   {
51     0x02080800, 0x00080000, 0x02000002, 0x02080802,
52     0x02000000, 0x00080802, 0x00080002, 0x02000002,
53     0x00080802, 0x02080800, 0x02080000, 0x00000802,
54     0x02000802, 0x02000000, 0x00000000, 0x00080002,
55     0x00080000, 0x00000002, 0x02000800, 0x00080800,
56     0x02080802, 0x02080000, 0x00000802, 0x02000800,
57     0x00000002, 0x00000800, 0x00080800, 0x02080002,
58     0x00000800, 0x02000802, 0x02080002, 0x00000000,
59     0x00000000, 0x02080802, 0x02000800, 0x00080002,
60     0x02080800, 0x00080000, 0x00000802, 0x02000800,
61     0x02080002, 0x00000800, 0x00080800, 0x02000002,
62     0x00080802, 0x00000002, 0x02000002, 0x02080000,
63     0x02080802, 0x00080800, 0x02080000, 0x02000802,
64     0x02000000, 0x00000802, 0x00080002, 0x00000000,
65     0x00080000, 0x02000000, 0x02000802, 0x02080800,
66     0x00000002, 0x02080002, 0x00000800, 0x00080802,
67   },
68   {
69     0x40108010, 0x00000000, 0x00108000, 0x40100000,
70     0x40000010, 0x00008010, 0x40008000, 0x00108000,
71     0x00008000, 0x40100010, 0x00000010, 0x40008000,
72     0x00100010, 0x40108000, 0x40100000, 0x00000010,
73     0x00100000, 0x40008010, 0x40100010, 0x00008000,
74     0x00108010, 0x40000000, 0x00000000, 0x00100010,
75     0x40008010, 0x00108010, 0x40108000, 0x40000010,
76     0x40000000, 0x00100000, 0x00008010, 0x40108010,
77     0x00100010, 0x40108000, 0x40008000, 0x00108010,
78     0x40108010, 0x00100010, 0x40000010, 0x00000000,
79     0x40000000, 0x00008010, 0x00100000, 0x40100010,
80     0x00008000, 0x40000000, 0x00108010, 0x40008010,
81     0x40108000, 0x00008000, 0x00000000, 0x40000010,
82     0x00000010, 0x40108010, 0x00108000, 0x40100000,
83     0x40100010, 0x00100000, 0x00008010, 0x40008000,
84     0x40008010, 0x00000010, 0x40100000, 0x00108000,
85   },
86   {
87     0x04000001, 0x04040100, 0x00000100, 0x04000101,
88     0x00040001, 0x04000000, 0x04000101, 0x00040100,
89     0x04000100, 0x00040000, 0x04040000, 0x00000001,
90     0x04040101, 0x00000101, 0x00000001, 0x04040001,
91     0x00000000, 0x00040001, 0x04040100, 0x00000100,
92     0x00000101, 0x04040101, 0x00040000, 0x04000001,
93     0x04040001, 0x04000100, 0x00040101, 0x04040000,
94     0x00040100, 0x00000000, 0x04000000, 0x00040101,
95     0x04040100, 0x00000100, 0x00000001, 0x00040000,
96     0x00000101, 0x00040001, 0x04040000, 0x04000101,
97     0x00000000, 0x04040100, 0x00040100, 0x04040001,
98     0x00040001, 0x04000000, 0x04040101, 0x00000001,
99     0x00040101, 0x04000001, 0x04000000, 0x04040101,
100     0x00040000, 0x04000100, 0x04000101, 0x00040100,
101     0x04000100, 0x00000000, 0x04040001, 0x00000101,
102     0x04000001, 0x00040101, 0x00000100, 0x04040000,
103   },
104   {
105     0x00401008, 0x10001000, 0x00000008, 0x10401008,
106     0x00000000, 0x10400000, 0x10001008, 0x00400008,
107     0x10401000, 0x10000008, 0x10000000, 0x00001008,
108     0x10000008, 0x00401008, 0x00400000, 0x10000000,
109     0x10400008, 0x00401000, 0x00001000, 0x00000008,
110     0x00401000, 0x10001008, 0x10400000, 0x00001000,
111     0x00001008, 0x00000000, 0x00400008, 0x10401000,
112     0x10001000, 0x10400008, 0x10401008, 0x00400000,
113     0x10400008, 0x00001008, 0x00400000, 0x10000008,
114     0x00401000, 0x10001000, 0x00000008, 0x10400000,
115     0x10001008, 0x00000000, 0x00001000, 0x00400008,
116     0x00000000, 0x10400008, 0x10401000, 0x00001000,
117     0x10000000, 0x10401008, 0x00401008, 0x00400000,
118     0x10401008, 0x00000008, 0x10001000, 0x00401008,
119     0x00400008, 0x00401000, 0x10400000, 0x10001008,
120     0x00001008, 0x10000000, 0x10000008, 0x10401000,
121   },
122   {
123     0x08000000, 0x00010000, 0x00000400, 0x08010420,
124     0x08010020, 0x08000400, 0x00010420, 0x08010000,
125     0x00010000, 0x00000020, 0x08000020, 0x00010400,
126     0x08000420, 0x08010020, 0x08010400, 0x00000000,
127     0x00010400, 0x08000000, 0x00010020, 0x00000420,
128     0x08000400, 0x00010420, 0x00000000, 0x08000020,
129     0x00000020, 0x08000420, 0x08010420, 0x00010020,
130     0x08010000, 0x00000400, 0x00000420, 0x08010400,
131     0x08010400, 0x08000420, 0x00010020, 0x08010000,
132     0x00010000, 0x00000020, 0x08000020, 0x08000400,
133     0x08000000, 0x00010400, 0x08010420, 0x00000000,
134     0x00010420, 0x08000000, 0x00000400, 0x00010020,
135     0x08000420, 0x00000400, 0x00000000, 0x08010420,
136     0x08010020, 0x08010400, 0x00000420, 0x00010000,
137     0x00010400, 0x08010020, 0x08000400, 0x00000420,
138     0x00000020, 0x00010420, 0x08010000, 0x08000020,
139   },
140   {
141     0x80000040, 0x00200040, 0x00000000, 0x80202000,
142     0x00200040, 0x00002000, 0x80002040, 0x00200000,
143     0x00002040, 0x80202040, 0x00202000, 0x80000000,
144     0x80002000, 0x80000040, 0x80200000, 0x00202040,
145     0x00200000, 0x80002040, 0x80200040, 0x00000000,
146     0x00002000, 0x00000040, 0x80202000, 0x80200040,
147     0x80202040, 0x80200000, 0x80000000, 0x00002040,
148     0x00000040, 0x00202000, 0x00202040, 0x80002000,
149     0x00002040, 0x80000000, 0x80002000, 0x00202040,
150     0x80202000, 0x00200040, 0x00000000, 0x80002000,
151     0x80000000, 0x00002000, 0x80200040, 0x00200000,
152     0x00200040, 0x80202040, 0x00202000, 0x00000040,
153     0x80202040, 0x00202000, 0x00200000, 0x80002040,
154     0x80000040, 0x80200000, 0x00202040, 0x00000000,
155     0x00002000, 0x80000040, 0x80002040, 0x80202000,
156     0x80200000, 0x00002040, 0x00000040, 0x80200040,
157   },
158   {
159     0x00004000, 0x00000200, 0x01000200, 0x01000004,
160     0x01004204, 0x00004004, 0x00004200, 0x00000000,
161     0x01000000, 0x01000204, 0x00000204, 0x01004000,
162     0x00000004, 0x01004200, 0x01004000, 0x00000204,
163     0x01000204, 0x00004000, 0x00004004, 0x01004204,
164     0x00000000, 0x01000200, 0x01000004, 0x00004200,
165     0x01004004, 0x00004204, 0x01004200, 0x00000004,
166     0x00004204, 0x01004004, 0x00000200, 0x01000000,
167     0x00004204, 0x01004000, 0x01004004, 0x00000204,
168     0x00004000, 0x00000200, 0x01000000, 0x01004004,
169     0x01000204, 0x00004204, 0x00004200, 0x00000000,
170     0x00000200, 0x01000004, 0x00000004, 0x01000200,
171     0x00000000, 0x01000204, 0x01000200, 0x00004200,
172     0x00000204, 0x00004000, 0x01004204, 0x01000000,
173     0x01004200, 0x00000004, 0x00004004, 0x01004204,
174     0x01000004, 0x01004200, 0x01004000, 0x00004004,
175   },
176   {
177     0x20800080, 0x20820000, 0x00020080, 0x00000000,
178     0x20020000, 0x00800080, 0x20800000, 0x20820080,
179     0x00000080, 0x20000000, 0x00820000, 0x00020080,
180     0x00820080, 0x20020080, 0x20000080, 0x20800000,
181     0x00020000, 0x00820080, 0x00800080, 0x20020000,
182     0x20820080, 0x20000080, 0x00000000, 0x00820000,
183     0x20000000, 0x00800000, 0x20020080, 0x20800080,
184     0x00800000, 0x00020000, 0x20820000, 0x00000080,
185     0x00800000, 0x00020000, 0x20000080, 0x20820080,
186     0x00020080, 0x20000000, 0x00000000, 0x00820000,
187     0x20800080, 0x20020080, 0x20020000, 0x00800080,
188     0x20820000, 0x00000080, 0x00800080, 0x20020000,
189     0x20820080, 0x00800000, 0x20800000, 0x20000080,
190     0x00820000, 0x00020080, 0x20020080, 0x20800000,
191     0x00000080, 0x20820000, 0x00820080, 0x00000000,
192     0x20000000, 0x20800080, 0x00020000, 0x00820080,
193   }
194 };
195
196 __constant u32 c_skb[8][64] =
197 {
198   {
199     0x00000000, 0x00000010, 0x20000000, 0x20000010,
200     0x00010000, 0x00010010, 0x20010000, 0x20010010,
201     0x00000800, 0x00000810, 0x20000800, 0x20000810,
202     0x00010800, 0x00010810, 0x20010800, 0x20010810,
203     0x00000020, 0x00000030, 0x20000020, 0x20000030,
204     0x00010020, 0x00010030, 0x20010020, 0x20010030,
205     0x00000820, 0x00000830, 0x20000820, 0x20000830,
206     0x00010820, 0x00010830, 0x20010820, 0x20010830,
207     0x00080000, 0x00080010, 0x20080000, 0x20080010,
208     0x00090000, 0x00090010, 0x20090000, 0x20090010,
209     0x00080800, 0x00080810, 0x20080800, 0x20080810,
210     0x00090800, 0x00090810, 0x20090800, 0x20090810,
211     0x00080020, 0x00080030, 0x20080020, 0x20080030,
212     0x00090020, 0x00090030, 0x20090020, 0x20090030,
213     0x00080820, 0x00080830, 0x20080820, 0x20080830,
214     0x00090820, 0x00090830, 0x20090820, 0x20090830,
215   },
216   {
217     0x00000000, 0x02000000, 0x00002000, 0x02002000,
218     0x00200000, 0x02200000, 0x00202000, 0x02202000,
219     0x00000004, 0x02000004, 0x00002004, 0x02002004,
220     0x00200004, 0x02200004, 0x00202004, 0x02202004,
221     0x00000400, 0x02000400, 0x00002400, 0x02002400,
222     0x00200400, 0x02200400, 0x00202400, 0x02202400,
223     0x00000404, 0x02000404, 0x00002404, 0x02002404,
224     0x00200404, 0x02200404, 0x00202404, 0x02202404,
225     0x10000000, 0x12000000, 0x10002000, 0x12002000,
226     0x10200000, 0x12200000, 0x10202000, 0x12202000,
227     0x10000004, 0x12000004, 0x10002004, 0x12002004,
228     0x10200004, 0x12200004, 0x10202004, 0x12202004,
229     0x10000400, 0x12000400, 0x10002400, 0x12002400,
230     0x10200400, 0x12200400, 0x10202400, 0x12202400,
231     0x10000404, 0x12000404, 0x10002404, 0x12002404,
232     0x10200404, 0x12200404, 0x10202404, 0x12202404,
233   },
234   {
235     0x00000000, 0x00000001, 0x00040000, 0x00040001,
236     0x01000000, 0x01000001, 0x01040000, 0x01040001,
237     0x00000002, 0x00000003, 0x00040002, 0x00040003,
238     0x01000002, 0x01000003, 0x01040002, 0x01040003,
239     0x00000200, 0x00000201, 0x00040200, 0x00040201,
240     0x01000200, 0x01000201, 0x01040200, 0x01040201,
241     0x00000202, 0x00000203, 0x00040202, 0x00040203,
242     0x01000202, 0x01000203, 0x01040202, 0x01040203,
243     0x08000000, 0x08000001, 0x08040000, 0x08040001,
244     0x09000000, 0x09000001, 0x09040000, 0x09040001,
245     0x08000002, 0x08000003, 0x08040002, 0x08040003,
246     0x09000002, 0x09000003, 0x09040002, 0x09040003,
247     0x08000200, 0x08000201, 0x08040200, 0x08040201,
248     0x09000200, 0x09000201, 0x09040200, 0x09040201,
249     0x08000202, 0x08000203, 0x08040202, 0x08040203,
250     0x09000202, 0x09000203, 0x09040202, 0x09040203,
251   },
252   {
253     0x00000000, 0x00100000, 0x00000100, 0x00100100,
254     0x00000008, 0x00100008, 0x00000108, 0x00100108,
255     0x00001000, 0x00101000, 0x00001100, 0x00101100,
256     0x00001008, 0x00101008, 0x00001108, 0x00101108,
257     0x04000000, 0x04100000, 0x04000100, 0x04100100,
258     0x04000008, 0x04100008, 0x04000108, 0x04100108,
259     0x04001000, 0x04101000, 0x04001100, 0x04101100,
260     0x04001008, 0x04101008, 0x04001108, 0x04101108,
261     0x00020000, 0x00120000, 0x00020100, 0x00120100,
262     0x00020008, 0x00120008, 0x00020108, 0x00120108,
263     0x00021000, 0x00121000, 0x00021100, 0x00121100,
264     0x00021008, 0x00121008, 0x00021108, 0x00121108,
265     0x04020000, 0x04120000, 0x04020100, 0x04120100,
266     0x04020008, 0x04120008, 0x04020108, 0x04120108,
267     0x04021000, 0x04121000, 0x04021100, 0x04121100,
268     0x04021008, 0x04121008, 0x04021108, 0x04121108,
269   },
270   {
271     0x00000000, 0x10000000, 0x00010000, 0x10010000,
272     0x00000004, 0x10000004, 0x00010004, 0x10010004,
273     0x20000000, 0x30000000, 0x20010000, 0x30010000,
274     0x20000004, 0x30000004, 0x20010004, 0x30010004,
275     0x00100000, 0x10100000, 0x00110000, 0x10110000,
276     0x00100004, 0x10100004, 0x00110004, 0x10110004,
277     0x20100000, 0x30100000, 0x20110000, 0x30110000,
278     0x20100004, 0x30100004, 0x20110004, 0x30110004,
279     0x00001000, 0x10001000, 0x00011000, 0x10011000,
280     0x00001004, 0x10001004, 0x00011004, 0x10011004,
281     0x20001000, 0x30001000, 0x20011000, 0x30011000,
282     0x20001004, 0x30001004, 0x20011004, 0x30011004,
283     0x00101000, 0x10101000, 0x00111000, 0x10111000,
284     0x00101004, 0x10101004, 0x00111004, 0x10111004,
285     0x20101000, 0x30101000, 0x20111000, 0x30111000,
286     0x20101004, 0x30101004, 0x20111004, 0x30111004,
287   },
288   {
289     0x00000000, 0x08000000, 0x00000008, 0x08000008,
290     0x00000400, 0x08000400, 0x00000408, 0x08000408,
291     0x00020000, 0x08020000, 0x00020008, 0x08020008,
292     0x00020400, 0x08020400, 0x00020408, 0x08020408,
293     0x00000001, 0x08000001, 0x00000009, 0x08000009,
294     0x00000401, 0x08000401, 0x00000409, 0x08000409,
295     0x00020001, 0x08020001, 0x00020009, 0x08020009,
296     0x00020401, 0x08020401, 0x00020409, 0x08020409,
297     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
298     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
299     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
300     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
301     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
302     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
303     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
304     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
305   },
306   {
307     0x00000000, 0x00000100, 0x00080000, 0x00080100,
308     0x01000000, 0x01000100, 0x01080000, 0x01080100,
309     0x00000010, 0x00000110, 0x00080010, 0x00080110,
310     0x01000010, 0x01000110, 0x01080010, 0x01080110,
311     0x00200000, 0x00200100, 0x00280000, 0x00280100,
312     0x01200000, 0x01200100, 0x01280000, 0x01280100,
313     0x00200010, 0x00200110, 0x00280010, 0x00280110,
314     0x01200010, 0x01200110, 0x01280010, 0x01280110,
315     0x00000200, 0x00000300, 0x00080200, 0x00080300,
316     0x01000200, 0x01000300, 0x01080200, 0x01080300,
317     0x00000210, 0x00000310, 0x00080210, 0x00080310,
318     0x01000210, 0x01000310, 0x01080210, 0x01080310,
319     0x00200200, 0x00200300, 0x00280200, 0x00280300,
320     0x01200200, 0x01200300, 0x01280200, 0x01280300,
321     0x00200210, 0x00200310, 0x00280210, 0x00280310,
322     0x01200210, 0x01200310, 0x01280210, 0x01280310,
323   },
324   {
325     0x00000000, 0x04000000, 0x00040000, 0x04040000,
326     0x00000002, 0x04000002, 0x00040002, 0x04040002,
327     0x00002000, 0x04002000, 0x00042000, 0x04042000,
328     0x00002002, 0x04002002, 0x00042002, 0x04042002,
329     0x00000020, 0x04000020, 0x00040020, 0x04040020,
330     0x00000022, 0x04000022, 0x00040022, 0x04040022,
331     0x00002020, 0x04002020, 0x00042020, 0x04042020,
332     0x00002022, 0x04002022, 0x00042022, 0x04042022,
333     0x00000800, 0x04000800, 0x00040800, 0x04040800,
334     0x00000802, 0x04000802, 0x00040802, 0x04040802,
335     0x00002800, 0x04002800, 0x00042800, 0x04042800,
336     0x00002802, 0x04002802, 0x00042802, 0x04042802,
337     0x00000820, 0x04000820, 0x00040820, 0x04040820,
338     0x00000822, 0x04000822, 0x00040822, 0x04040822,
339     0x00002820, 0x04002820, 0x00042820, 0x04042820,
340     0x00002822, 0x04002822, 0x00042822, 0x04042822
341   }
342 };
343
344 #define LM_IV_0_IP_RR3 0x2400b807
345 #define LM_IV_1_IP_RR3 0xaa190747
346
347 #if   VECT_SIZE == 1
348 #define BOX(i,n,S) (S)[(n)][(i)]
349 #elif VECT_SIZE == 2
350 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1])
351 #elif VECT_SIZE == 4
352 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3])
353 #elif VECT_SIZE == 8
354 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7])
355 #elif VECT_SIZE == 16
356 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7], (S)[(n)][(i).s8], (S)[(n)][(i).s9], (S)[(n)][(i).sa], (S)[(n)][(i).sb], (S)[(n)][(i).sc], (S)[(n)][(i).sd], (S)[(n)][(i).se], (S)[(n)][(i).sf])
357 #endif
358
359 void _des_crypt_encrypt (u32x iv[2], u32x data[2], u32x Kc[16], u32x Kd[16], __local u32 (*s_SPtrans)[64])
360 {
361   u32x r = data[0];
362   u32x l = data[1];
363
364   #pragma unroll 16
365   for (u32 i = 0; i < 16; i += 2)
366   {
367     u32x u;
368     u32x t;
369
370     u = Kc[i + 0] ^ rotl32 (r, 30u);
371     t = Kd[i + 0] ^ rotl32 (r, 26u);
372
373     l ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
374        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
375        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
376        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
377        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
378        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
379        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
380        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
381
382     u = Kc[i + 1] ^ rotl32 (l, 30u);
383     t = Kd[i + 1] ^ rotl32 (l, 26u);
384
385     r ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
386        | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
387        | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
388        | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
389        | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
390        | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
391        | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
392        | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
393   }
394
395   iv[0] = rotl32 (l, 29);
396   iv[1] = rotl32 (r, 29);
397 }
398
399 void _des_crypt_keysetup (u32x c, u32x d, u32x Kc[16], u32x Kd[16], __local u32 (*s_skb)[64])
400 {
401   u32x tt;
402
403   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
404   HPERM_OP (c,    tt, 2, 0xcccc0000);
405   HPERM_OP (d,    tt, 2, 0xcccc0000);
406   PERM_OP  (d, c, tt, 1, 0x55555555);
407   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
408   PERM_OP  (d, c, tt, 1, 0x55555555);
409
410   d = ((d & 0x000000ff) << 16)
411     | ((d & 0x0000ff00) <<  0)
412     | ((d & 0x00ff0000) >> 16)
413     | ((c & 0xf0000000) >>  4);
414
415   c = c & 0x0fffffff;
416
417   #pragma unroll 16
418   for (u32 i = 0; i < 16; i++)
419   {
420     if ((i < 2) || (i == 8) || (i == 15))
421     {
422       c = ((c >> 1) | (c << 27));
423       d = ((d >> 1) | (d << 27));
424     }
425     else
426     {
427       c = ((c >> 2) | (c << 26));
428       d = ((d >> 2) | (d << 26));
429     }
430
431     c = c & 0x0fffffff;
432     d = d & 0x0fffffff;
433
434     const u32x c00 = (c >>  0) & 0x0000003f;
435     const u32x c06 = (c >>  6) & 0x00383003;
436     const u32x c07 = (c >>  7) & 0x0000003c;
437     const u32x c13 = (c >> 13) & 0x0000060f;
438     const u32x c20 = (c >> 20) & 0x00000001;
439
440     u32x s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
441            | BOX (((c06 >>  0) & 0xff)
442                  |((c07 >>  0) & 0xff), 1, s_skb)
443            | BOX (((c13 >>  0) & 0xff)
444                  |((c06 >>  8) & 0xff), 2, s_skb)
445            | BOX (((c20 >>  0) & 0xff)
446                  |((c13 >>  8) & 0xff)
447                  |((c06 >> 16) & 0xff), 3, s_skb);
448
449     const u32x d00 = (d >>  0) & 0x00003c3f;
450     const u32x d07 = (d >>  7) & 0x00003f03;
451     const u32x d21 = (d >> 21) & 0x0000000f;
452     const u32x d22 = (d >> 22) & 0x00000030;
453
454     u32x t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
455            | BOX (((d07 >>  0) & 0xff)
456                  |((d00 >>  8) & 0xff), 5, s_skb)
457            | BOX (((d07 >>  8) & 0xff), 6, s_skb)
458            | BOX (((d21 >>  0) & 0xff)
459                  |((d22 >>  0) & 0xff), 7, s_skb);
460
461     Kc[i] = ((t << 16) | (s & 0x0000ffff));
462     Kd[i] = ((s >> 16) | (t & 0xffff0000));
463   }
464 }
465
466 void transform_netntlmv1_key (const u32x w0, const u32x w1, u32x out[2])
467 {
468   u32x t[8];
469
470   t[0] = (w0 >>  0) & 0xff;
471   t[1] = (w0 >>  8) & 0xff;
472   t[2] = (w0 >> 16) & 0xff;
473   t[3] = (w0 >> 24) & 0xff;
474   t[4] = (w1 >>  0) & 0xff;
475   t[5] = (w1 >>  8) & 0xff;
476   t[6] = (w1 >> 16) & 0xff;
477   t[7] = (w1 >> 24) & 0xff;
478
479   u32x k[8];
480
481   k[0] =               (t[0] >> 0);
482   k[1] = (t[0] << 7) | (t[1] >> 1);
483   k[2] = (t[1] << 6) | (t[2] >> 2);
484   k[3] = (t[2] << 5) | (t[3] >> 3);
485   k[4] = (t[3] << 4) | (t[4] >> 4);
486   k[5] = (t[4] << 3) | (t[5] >> 5);
487   k[6] = (t[5] << 2) | (t[6] >> 6);
488   k[7] = (t[6] << 1);
489
490   out[0] = ((k[0] & 0xff) <<  0)
491          | ((k[1] & 0xff) <<  8)
492          | ((k[2] & 0xff) << 16)
493          | ((k[3] & 0xff) << 24);
494
495   out[1] = ((k[4] & 0xff) <<  0)
496          | ((k[5] & 0xff) <<  8)
497          | ((k[6] & 0xff) << 16)
498          | ((k[7] & 0xff) << 24);
499 }
500
501 __kernel void m03000_m04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
502 {
503   /**
504    * modifier
505    */
506
507   const u32 gid = get_global_id (0);
508   const u32 lid = get_local_id (0);
509   const u32 lsz = get_local_size (0);
510
511   /**
512    * sbox, kbox
513    */
514
515   __local u32 s_SPtrans[8][64];
516   __local u32 s_skb[8][64];
517
518   for (u32 i = lid; i < 64; i += lsz)
519   {
520     s_SPtrans[0][i] = c_SPtrans[0][i];
521     s_SPtrans[1][i] = c_SPtrans[1][i];
522     s_SPtrans[2][i] = c_SPtrans[2][i];
523     s_SPtrans[3][i] = c_SPtrans[3][i];
524     s_SPtrans[4][i] = c_SPtrans[4][i];
525     s_SPtrans[5][i] = c_SPtrans[5][i];
526     s_SPtrans[6][i] = c_SPtrans[6][i];
527     s_SPtrans[7][i] = c_SPtrans[7][i];
528
529     s_skb[0][i] = c_skb[0][i];
530     s_skb[1][i] = c_skb[1][i];
531     s_skb[2][i] = c_skb[2][i];
532     s_skb[3][i] = c_skb[3][i];
533     s_skb[4][i] = c_skb[4][i];
534     s_skb[5][i] = c_skb[5][i];
535     s_skb[6][i] = c_skb[6][i];
536     s_skb[7][i] = c_skb[7][i];
537   }
538
539   barrier (CLK_LOCAL_MEM_FENCE);
540
541   if (gid >= gid_max) return;
542
543   /**
544    * base
545    */
546
547   u32 pw_buf0[4];
548   u32 pw_buf1[4];
549
550   pw_buf0[0] = pws[gid].i[0];
551   pw_buf0[1] = pws[gid].i[1];
552   pw_buf0[2] = pws[gid].i[2];
553   pw_buf0[3] = pws[gid].i[3];
554   pw_buf1[0] = pws[gid].i[4];
555   pw_buf1[1] = pws[gid].i[5];
556   pw_buf1[2] = pws[gid].i[6];
557   pw_buf1[3] = pws[gid].i[7];
558
559   const u32 pw_len = pws[gid].pw_len;
560
561   /**
562    * main
563    */
564
565   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
566   {
567     u32x w0[4] = { 0 };
568     u32x w1[4] = { 0 };
569     u32x w2[4] = { 0 };
570     u32x w3[4] = { 0 };
571
572     const u32x out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
573
574     u32x key[2];
575
576     transform_netntlmv1_key (w0[0], w0[1], key);
577
578     const u32x c = key[0];
579     const u32x d = key[1];
580
581     u32x Kc[16];
582     u32x Kd[16];
583
584     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
585
586     u32x data[2];
587
588     data[0] = LM_IV_0_IP_RR3;
589     data[1] = LM_IV_1_IP_RR3;
590
591     u32x iv[2];
592
593     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
594
595     const u32x r0 = iv[0];
596     const u32x r1 = iv[1];
597     const u32x r2 = 0;
598     const u32x r3 = 0;
599
600     COMPARE_M_SIMD (r0, r1, r2, r3);
601   }
602 }
603
604 __kernel void m03000_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
605 {
606 }
607
608 __kernel void m03000_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
609 {
610 }
611
612 __kernel void m03000_s04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
613 {
614   /**
615    * modifier
616    */
617
618   const u32 gid = get_global_id (0);
619   const u32 lid = get_local_id (0);
620   const u32 lsz = get_local_size (0);
621
622   /**
623    * sbox, kbox
624    */
625
626   __local u32 s_SPtrans[8][64];
627   __local u32 s_skb[8][64];
628
629   for (u32 i = lid; i < 64; i += lsz)
630   {
631     s_SPtrans[0][i] = c_SPtrans[0][i];
632     s_SPtrans[1][i] = c_SPtrans[1][i];
633     s_SPtrans[2][i] = c_SPtrans[2][i];
634     s_SPtrans[3][i] = c_SPtrans[3][i];
635     s_SPtrans[4][i] = c_SPtrans[4][i];
636     s_SPtrans[5][i] = c_SPtrans[5][i];
637     s_SPtrans[6][i] = c_SPtrans[6][i];
638     s_SPtrans[7][i] = c_SPtrans[7][i];
639
640     s_skb[0][i] = c_skb[0][i];
641     s_skb[1][i] = c_skb[1][i];
642     s_skb[2][i] = c_skb[2][i];
643     s_skb[3][i] = c_skb[3][i];
644     s_skb[4][i] = c_skb[4][i];
645     s_skb[5][i] = c_skb[5][i];
646     s_skb[6][i] = c_skb[6][i];
647     s_skb[7][i] = c_skb[7][i];
648   }
649
650   barrier (CLK_LOCAL_MEM_FENCE);
651
652   if (gid >= gid_max) return;
653
654   /**
655    * base
656    */
657
658   u32 pw_buf0[4];
659   u32 pw_buf1[4];
660
661   pw_buf0[0] = pws[gid].i[0];
662   pw_buf0[1] = pws[gid].i[1];
663   pw_buf0[2] = pws[gid].i[2];
664   pw_buf0[3] = pws[gid].i[3];
665   pw_buf1[0] = pws[gid].i[4];
666   pw_buf1[1] = pws[gid].i[5];
667   pw_buf1[2] = pws[gid].i[6];
668   pw_buf1[3] = pws[gid].i[7];
669
670   const u32 pw_len = pws[gid].pw_len;
671
672   /**
673    * digest
674    */
675
676   const u32 search[4] =
677   {
678     digests_buf[digests_offset].digest_buf[DGST_R0],
679     digests_buf[digests_offset].digest_buf[DGST_R1],
680     digests_buf[digests_offset].digest_buf[DGST_R2],
681     digests_buf[digests_offset].digest_buf[DGST_R3]
682   };
683
684   /**
685    * main
686    */
687
688   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
689   {
690     u32x w0[4] = { 0 };
691     u32x w1[4] = { 0 };
692     u32x w2[4] = { 0 };
693     u32x w3[4] = { 0 };
694
695     const u32x out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
696
697     u32x key[2];
698
699     transform_netntlmv1_key (w0[0], w0[1], key);
700
701     const u32x c = key[0];
702     const u32x d = key[1];
703
704     u32x Kc[16];
705     u32x Kd[16];
706
707     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
708
709     u32x data[2];
710
711     data[0] = LM_IV_0_IP_RR3;
712     data[1] = LM_IV_1_IP_RR3;
713
714     u32x iv[2];
715
716     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
717
718     const u32x r0 = iv[0];
719     const u32x r1 = iv[1];
720     const u32x r2 = 0;
721     const u32x r3 = 0;
722
723     COMPARE_S_SIMD (r0, r1, r2, r3);
724   }
725 }
726
727 __kernel void m03000_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
728 {
729 }
730
731 __kernel void m03000_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
732 {
733 }