Converted to new SIMD: -m 1500 -a 0
[hashcat.git] / OpenCL / m01500_a0.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _DES_
9
10 #define NEW_SIMD_CODE
11
12 #include "include/constants.h"
13 #include "include/kernel_vendor.h"
14
15 #define DGST_R0 0
16 #define DGST_R1 1
17 #define DGST_R2 2
18 #define DGST_R3 3
19
20 #include "include/kernel_functions.c"
21 #include "OpenCL/types_ocl.c"
22 #include "OpenCL/common.c"
23 #include "include/rp_kernel.h"
24 #include "OpenCL/rp.c"
25 #include "OpenCL/simd.c"
26
27 #define PERM_OP(a,b,tt,n,m) \
28 {                           \
29   tt = a >> n;              \
30   tt = tt ^ b;              \
31   tt = tt & m;              \
32   b = b ^ tt;               \
33   tt = tt << n;             \
34   a = a ^ tt;               \
35 }
36
37 #define HPERM_OP(a,tt,n,m)  \
38 {                           \
39   tt = a << (16 + n);       \
40   tt = tt ^ a;              \
41   tt = tt & m;              \
42   a  = a ^ tt;              \
43   tt = tt >> (16 + n);      \
44   a  = a ^ tt;              \
45 }
46
47 __constant u32 c_SPtrans[8][64] =
48 {
49   {
50     0x00820200, 0x00020000, 0x80800000, 0x80820200,
51     0x00800000, 0x80020200, 0x80020000, 0x80800000,
52     0x80020200, 0x00820200, 0x00820000, 0x80000200,
53     0x80800200, 0x00800000, 0x00000000, 0x80020000,
54     0x00020000, 0x80000000, 0x00800200, 0x00020200,
55     0x80820200, 0x00820000, 0x80000200, 0x00800200,
56     0x80000000, 0x00000200, 0x00020200, 0x80820000,
57     0x00000200, 0x80800200, 0x80820000, 0x00000000,
58     0x00000000, 0x80820200, 0x00800200, 0x80020000,
59     0x00820200, 0x00020000, 0x80000200, 0x00800200,
60     0x80820000, 0x00000200, 0x00020200, 0x80800000,
61     0x80020200, 0x80000000, 0x80800000, 0x00820000,
62     0x80820200, 0x00020200, 0x00820000, 0x80800200,
63     0x00800000, 0x80000200, 0x80020000, 0x00000000,
64     0x00020000, 0x00800000, 0x80800200, 0x00820200,
65     0x80000000, 0x80820000, 0x00000200, 0x80020200,
66   },
67   {
68     0x10042004, 0x00000000, 0x00042000, 0x10040000,
69     0x10000004, 0x00002004, 0x10002000, 0x00042000,
70     0x00002000, 0x10040004, 0x00000004, 0x10002000,
71     0x00040004, 0x10042000, 0x10040000, 0x00000004,
72     0x00040000, 0x10002004, 0x10040004, 0x00002000,
73     0x00042004, 0x10000000, 0x00000000, 0x00040004,
74     0x10002004, 0x00042004, 0x10042000, 0x10000004,
75     0x10000000, 0x00040000, 0x00002004, 0x10042004,
76     0x00040004, 0x10042000, 0x10002000, 0x00042004,
77     0x10042004, 0x00040004, 0x10000004, 0x00000000,
78     0x10000000, 0x00002004, 0x00040000, 0x10040004,
79     0x00002000, 0x10000000, 0x00042004, 0x10002004,
80     0x10042000, 0x00002000, 0x00000000, 0x10000004,
81     0x00000004, 0x10042004, 0x00042000, 0x10040000,
82     0x10040004, 0x00040000, 0x00002004, 0x10002000,
83     0x10002004, 0x00000004, 0x10040000, 0x00042000,
84   },
85   {
86     0x41000000, 0x01010040, 0x00000040, 0x41000040,
87     0x40010000, 0x01000000, 0x41000040, 0x00010040,
88     0x01000040, 0x00010000, 0x01010000, 0x40000000,
89     0x41010040, 0x40000040, 0x40000000, 0x41010000,
90     0x00000000, 0x40010000, 0x01010040, 0x00000040,
91     0x40000040, 0x41010040, 0x00010000, 0x41000000,
92     0x41010000, 0x01000040, 0x40010040, 0x01010000,
93     0x00010040, 0x00000000, 0x01000000, 0x40010040,
94     0x01010040, 0x00000040, 0x40000000, 0x00010000,
95     0x40000040, 0x40010000, 0x01010000, 0x41000040,
96     0x00000000, 0x01010040, 0x00010040, 0x41010000,
97     0x40010000, 0x01000000, 0x41010040, 0x40000000,
98     0x40010040, 0x41000000, 0x01000000, 0x41010040,
99     0x00010000, 0x01000040, 0x41000040, 0x00010040,
100     0x01000040, 0x00000000, 0x41010000, 0x40000040,
101     0x41000000, 0x40010040, 0x00000040, 0x01010000,
102   },
103   {
104     0x00100402, 0x04000400, 0x00000002, 0x04100402,
105     0x00000000, 0x04100000, 0x04000402, 0x00100002,
106     0x04100400, 0x04000002, 0x04000000, 0x00000402,
107     0x04000002, 0x00100402, 0x00100000, 0x04000000,
108     0x04100002, 0x00100400, 0x00000400, 0x00000002,
109     0x00100400, 0x04000402, 0x04100000, 0x00000400,
110     0x00000402, 0x00000000, 0x00100002, 0x04100400,
111     0x04000400, 0x04100002, 0x04100402, 0x00100000,
112     0x04100002, 0x00000402, 0x00100000, 0x04000002,
113     0x00100400, 0x04000400, 0x00000002, 0x04100000,
114     0x04000402, 0x00000000, 0x00000400, 0x00100002,
115     0x00000000, 0x04100002, 0x04100400, 0x00000400,
116     0x04000000, 0x04100402, 0x00100402, 0x00100000,
117     0x04100402, 0x00000002, 0x04000400, 0x00100402,
118     0x00100002, 0x00100400, 0x04100000, 0x04000402,
119     0x00000402, 0x04000000, 0x04000002, 0x04100400,
120   },
121   {
122     0x02000000, 0x00004000, 0x00000100, 0x02004108,
123     0x02004008, 0x02000100, 0x00004108, 0x02004000,
124     0x00004000, 0x00000008, 0x02000008, 0x00004100,
125     0x02000108, 0x02004008, 0x02004100, 0x00000000,
126     0x00004100, 0x02000000, 0x00004008, 0x00000108,
127     0x02000100, 0x00004108, 0x00000000, 0x02000008,
128     0x00000008, 0x02000108, 0x02004108, 0x00004008,
129     0x02004000, 0x00000100, 0x00000108, 0x02004100,
130     0x02004100, 0x02000108, 0x00004008, 0x02004000,
131     0x00004000, 0x00000008, 0x02000008, 0x02000100,
132     0x02000000, 0x00004100, 0x02004108, 0x00000000,
133     0x00004108, 0x02000000, 0x00000100, 0x00004008,
134     0x02000108, 0x00000100, 0x00000000, 0x02004108,
135     0x02004008, 0x02004100, 0x00000108, 0x00004000,
136     0x00004100, 0x02004008, 0x02000100, 0x00000108,
137     0x00000008, 0x00004108, 0x02004000, 0x02000008,
138   },
139   {
140     0x20000010, 0x00080010, 0x00000000, 0x20080800,
141     0x00080010, 0x00000800, 0x20000810, 0x00080000,
142     0x00000810, 0x20080810, 0x00080800, 0x20000000,
143     0x20000800, 0x20000010, 0x20080000, 0x00080810,
144     0x00080000, 0x20000810, 0x20080010, 0x00000000,
145     0x00000800, 0x00000010, 0x20080800, 0x20080010,
146     0x20080810, 0x20080000, 0x20000000, 0x00000810,
147     0x00000010, 0x00080800, 0x00080810, 0x20000800,
148     0x00000810, 0x20000000, 0x20000800, 0x00080810,
149     0x20080800, 0x00080010, 0x00000000, 0x20000800,
150     0x20000000, 0x00000800, 0x20080010, 0x00080000,
151     0x00080010, 0x20080810, 0x00080800, 0x00000010,
152     0x20080810, 0x00080800, 0x00080000, 0x20000810,
153     0x20000010, 0x20080000, 0x00080810, 0x00000000,
154     0x00000800, 0x20000010, 0x20000810, 0x20080800,
155     0x20080000, 0x00000810, 0x00000010, 0x20080010,
156   },
157   {
158     0x00001000, 0x00000080, 0x00400080, 0x00400001,
159     0x00401081, 0x00001001, 0x00001080, 0x00000000,
160     0x00400000, 0x00400081, 0x00000081, 0x00401000,
161     0x00000001, 0x00401080, 0x00401000, 0x00000081,
162     0x00400081, 0x00001000, 0x00001001, 0x00401081,
163     0x00000000, 0x00400080, 0x00400001, 0x00001080,
164     0x00401001, 0x00001081, 0x00401080, 0x00000001,
165     0x00001081, 0x00401001, 0x00000080, 0x00400000,
166     0x00001081, 0x00401000, 0x00401001, 0x00000081,
167     0x00001000, 0x00000080, 0x00400000, 0x00401001,
168     0x00400081, 0x00001081, 0x00001080, 0x00000000,
169     0x00000080, 0x00400001, 0x00000001, 0x00400080,
170     0x00000000, 0x00400081, 0x00400080, 0x00001080,
171     0x00000081, 0x00001000, 0x00401081, 0x00400000,
172     0x00401080, 0x00000001, 0x00001001, 0x00401081,
173     0x00400001, 0x00401080, 0x00401000, 0x00001001,
174   },
175   {
176     0x08200020, 0x08208000, 0x00008020, 0x00000000,
177     0x08008000, 0x00200020, 0x08200000, 0x08208020,
178     0x00000020, 0x08000000, 0x00208000, 0x00008020,
179     0x00208020, 0x08008020, 0x08000020, 0x08200000,
180     0x00008000, 0x00208020, 0x00200020, 0x08008000,
181     0x08208020, 0x08000020, 0x00000000, 0x00208000,
182     0x08000000, 0x00200000, 0x08008020, 0x08200020,
183     0x00200000, 0x00008000, 0x08208000, 0x00000020,
184     0x00200000, 0x00008000, 0x08000020, 0x08208020,
185     0x00008020, 0x08000000, 0x00000000, 0x00208000,
186     0x08200020, 0x08008020, 0x08008000, 0x00200020,
187     0x08208000, 0x00000020, 0x00200020, 0x08008000,
188     0x08208020, 0x00200000, 0x08200000, 0x08000020,
189     0x00208000, 0x00008020, 0x08008020, 0x08200000,
190     0x00000020, 0x08208000, 0x00208020, 0x00000000,
191     0x08000000, 0x08200020, 0x00008000, 0x00208020
192   },
193 };
194
195 __constant u32 c_skb[8][64] =
196 {
197   {
198     0x00000000, 0x00000010, 0x20000000, 0x20000010,
199     0x00010000, 0x00010010, 0x20010000, 0x20010010,
200     0x00000800, 0x00000810, 0x20000800, 0x20000810,
201     0x00010800, 0x00010810, 0x20010800, 0x20010810,
202     0x00000020, 0x00000030, 0x20000020, 0x20000030,
203     0x00010020, 0x00010030, 0x20010020, 0x20010030,
204     0x00000820, 0x00000830, 0x20000820, 0x20000830,
205     0x00010820, 0x00010830, 0x20010820, 0x20010830,
206     0x00080000, 0x00080010, 0x20080000, 0x20080010,
207     0x00090000, 0x00090010, 0x20090000, 0x20090010,
208     0x00080800, 0x00080810, 0x20080800, 0x20080810,
209     0x00090800, 0x00090810, 0x20090800, 0x20090810,
210     0x00080020, 0x00080030, 0x20080020, 0x20080030,
211     0x00090020, 0x00090030, 0x20090020, 0x20090030,
212     0x00080820, 0x00080830, 0x20080820, 0x20080830,
213     0x00090820, 0x00090830, 0x20090820, 0x20090830,
214   },
215   {
216     0x00000000, 0x02000000, 0x00002000, 0x02002000,
217     0x00200000, 0x02200000, 0x00202000, 0x02202000,
218     0x00000004, 0x02000004, 0x00002004, 0x02002004,
219     0x00200004, 0x02200004, 0x00202004, 0x02202004,
220     0x00000400, 0x02000400, 0x00002400, 0x02002400,
221     0x00200400, 0x02200400, 0x00202400, 0x02202400,
222     0x00000404, 0x02000404, 0x00002404, 0x02002404,
223     0x00200404, 0x02200404, 0x00202404, 0x02202404,
224     0x10000000, 0x12000000, 0x10002000, 0x12002000,
225     0x10200000, 0x12200000, 0x10202000, 0x12202000,
226     0x10000004, 0x12000004, 0x10002004, 0x12002004,
227     0x10200004, 0x12200004, 0x10202004, 0x12202004,
228     0x10000400, 0x12000400, 0x10002400, 0x12002400,
229     0x10200400, 0x12200400, 0x10202400, 0x12202400,
230     0x10000404, 0x12000404, 0x10002404, 0x12002404,
231     0x10200404, 0x12200404, 0x10202404, 0x12202404,
232   },
233   {
234     0x00000000, 0x00000001, 0x00040000, 0x00040001,
235     0x01000000, 0x01000001, 0x01040000, 0x01040001,
236     0x00000002, 0x00000003, 0x00040002, 0x00040003,
237     0x01000002, 0x01000003, 0x01040002, 0x01040003,
238     0x00000200, 0x00000201, 0x00040200, 0x00040201,
239     0x01000200, 0x01000201, 0x01040200, 0x01040201,
240     0x00000202, 0x00000203, 0x00040202, 0x00040203,
241     0x01000202, 0x01000203, 0x01040202, 0x01040203,
242     0x08000000, 0x08000001, 0x08040000, 0x08040001,
243     0x09000000, 0x09000001, 0x09040000, 0x09040001,
244     0x08000002, 0x08000003, 0x08040002, 0x08040003,
245     0x09000002, 0x09000003, 0x09040002, 0x09040003,
246     0x08000200, 0x08000201, 0x08040200, 0x08040201,
247     0x09000200, 0x09000201, 0x09040200, 0x09040201,
248     0x08000202, 0x08000203, 0x08040202, 0x08040203,
249     0x09000202, 0x09000203, 0x09040202, 0x09040203,
250   },
251   {
252     0x00000000, 0x00100000, 0x00000100, 0x00100100,
253     0x00000008, 0x00100008, 0x00000108, 0x00100108,
254     0x00001000, 0x00101000, 0x00001100, 0x00101100,
255     0x00001008, 0x00101008, 0x00001108, 0x00101108,
256     0x04000000, 0x04100000, 0x04000100, 0x04100100,
257     0x04000008, 0x04100008, 0x04000108, 0x04100108,
258     0x04001000, 0x04101000, 0x04001100, 0x04101100,
259     0x04001008, 0x04101008, 0x04001108, 0x04101108,
260     0x00020000, 0x00120000, 0x00020100, 0x00120100,
261     0x00020008, 0x00120008, 0x00020108, 0x00120108,
262     0x00021000, 0x00121000, 0x00021100, 0x00121100,
263     0x00021008, 0x00121008, 0x00021108, 0x00121108,
264     0x04020000, 0x04120000, 0x04020100, 0x04120100,
265     0x04020008, 0x04120008, 0x04020108, 0x04120108,
266     0x04021000, 0x04121000, 0x04021100, 0x04121100,
267     0x04021008, 0x04121008, 0x04021108, 0x04121108,
268   },
269   {
270     0x00000000, 0x10000000, 0x00010000, 0x10010000,
271     0x00000004, 0x10000004, 0x00010004, 0x10010004,
272     0x20000000, 0x30000000, 0x20010000, 0x30010000,
273     0x20000004, 0x30000004, 0x20010004, 0x30010004,
274     0x00100000, 0x10100000, 0x00110000, 0x10110000,
275     0x00100004, 0x10100004, 0x00110004, 0x10110004,
276     0x20100000, 0x30100000, 0x20110000, 0x30110000,
277     0x20100004, 0x30100004, 0x20110004, 0x30110004,
278     0x00001000, 0x10001000, 0x00011000, 0x10011000,
279     0x00001004, 0x10001004, 0x00011004, 0x10011004,
280     0x20001000, 0x30001000, 0x20011000, 0x30011000,
281     0x20001004, 0x30001004, 0x20011004, 0x30011004,
282     0x00101000, 0x10101000, 0x00111000, 0x10111000,
283     0x00101004, 0x10101004, 0x00111004, 0x10111004,
284     0x20101000, 0x30101000, 0x20111000, 0x30111000,
285     0x20101004, 0x30101004, 0x20111004, 0x30111004,
286   },
287   {
288     0x00000000, 0x08000000, 0x00000008, 0x08000008,
289     0x00000400, 0x08000400, 0x00000408, 0x08000408,
290     0x00020000, 0x08020000, 0x00020008, 0x08020008,
291     0x00020400, 0x08020400, 0x00020408, 0x08020408,
292     0x00000001, 0x08000001, 0x00000009, 0x08000009,
293     0x00000401, 0x08000401, 0x00000409, 0x08000409,
294     0x00020001, 0x08020001, 0x00020009, 0x08020009,
295     0x00020401, 0x08020401, 0x00020409, 0x08020409,
296     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
297     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
298     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
299     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
300     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
301     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
302     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
303     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
304   },
305   {
306     0x00000000, 0x00000100, 0x00080000, 0x00080100,
307     0x01000000, 0x01000100, 0x01080000, 0x01080100,
308     0x00000010, 0x00000110, 0x00080010, 0x00080110,
309     0x01000010, 0x01000110, 0x01080010, 0x01080110,
310     0x00200000, 0x00200100, 0x00280000, 0x00280100,
311     0x01200000, 0x01200100, 0x01280000, 0x01280100,
312     0x00200010, 0x00200110, 0x00280010, 0x00280110,
313     0x01200010, 0x01200110, 0x01280010, 0x01280110,
314     0x00000200, 0x00000300, 0x00080200, 0x00080300,
315     0x01000200, 0x01000300, 0x01080200, 0x01080300,
316     0x00000210, 0x00000310, 0x00080210, 0x00080310,
317     0x01000210, 0x01000310, 0x01080210, 0x01080310,
318     0x00200200, 0x00200300, 0x00280200, 0x00280300,
319     0x01200200, 0x01200300, 0x01280200, 0x01280300,
320     0x00200210, 0x00200310, 0x00280210, 0x00280310,
321     0x01200210, 0x01200310, 0x01280210, 0x01280310,
322   },
323   {
324     0x00000000, 0x04000000, 0x00040000, 0x04040000,
325     0x00000002, 0x04000002, 0x00040002, 0x04040002,
326     0x00002000, 0x04002000, 0x00042000, 0x04042000,
327     0x00002002, 0x04002002, 0x00042002, 0x04042002,
328     0x00000020, 0x04000020, 0x00040020, 0x04040020,
329     0x00000022, 0x04000022, 0x00040022, 0x04040022,
330     0x00002020, 0x04002020, 0x00042020, 0x04042020,
331     0x00002022, 0x04002022, 0x00042022, 0x04042022,
332     0x00000800, 0x04000800, 0x00040800, 0x04040800,
333     0x00000802, 0x04000802, 0x00040802, 0x04040802,
334     0x00002800, 0x04002800, 0x00042800, 0x04042800,
335     0x00002802, 0x04002802, 0x00042802, 0x04042802,
336     0x00000820, 0x04000820, 0x00040820, 0x04040820,
337     0x00000822, 0x04000822, 0x00040822, 0x04040822,
338     0x00002820, 0x04002820, 0x00042820, 0x04042820,
339     0x00002822, 0x04002822, 0x00042822, 0x04042822
340   },
341 };
342
343 #if   VECT_SIZE == 1
344 #define BOX(i,n,S) (S)[(n)][(i)]
345 #elif VECT_SIZE == 2
346 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1])
347 #elif VECT_SIZE == 4
348 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3])
349 #elif VECT_SIZE == 8
350 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7])
351 #endif
352
353 static void _des_crypt_keysetup (u32x c, u32x d, u32x Kc[16], u32x Kd[16], __local u32 (*s_skb)[64])
354 {
355   u32x tt;
356
357   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
358   HPERM_OP (c,    tt, 2, 0xcccc0000);
359   HPERM_OP (d,    tt, 2, 0xcccc0000);
360   PERM_OP  (d, c, tt, 1, 0x55555555);
361   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
362   PERM_OP  (d, c, tt, 1, 0x55555555);
363
364   d = ((d & 0x000000ff) << 16)
365     | ((d & 0x0000ff00) <<  0)
366     | ((d & 0x00ff0000) >> 16)
367     | ((c & 0xf0000000) >>  4);
368
369   c = c & 0x0fffffff;
370
371   #pragma unroll 16
372   for (u32 i = 0; i < 16; i++)
373   {
374     if ((i < 2) || (i == 8) || (i == 15))
375     {
376       c = ((c >> 1) | (c << 27));
377       d = ((d >> 1) | (d << 27));
378     }
379     else
380     {
381       c = ((c >> 2) | (c << 26));
382       d = ((d >> 2) | (d << 26));
383     }
384
385     c = c & 0x0fffffff;
386     d = d & 0x0fffffff;
387
388     const u32x c00 = (c >>  0) & 0x0000003f;
389     const u32x c06 = (c >>  6) & 0x00383003;
390     const u32x c07 = (c >>  7) & 0x0000003c;
391     const u32x c13 = (c >> 13) & 0x0000060f;
392     const u32x c20 = (c >> 20) & 0x00000001;
393
394     u32x s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
395            | BOX (((c06 >>  0) & 0xff)
396                  |((c07 >>  0) & 0xff), 1, s_skb)
397            | BOX (((c13 >>  0) & 0xff)
398                  |((c06 >>  8) & 0xff), 2, s_skb)
399            | BOX (((c20 >>  0) & 0xff)
400                  |((c13 >>  8) & 0xff)
401                  |((c06 >> 16) & 0xff), 3, s_skb);
402
403     const u32x d00 = (d >>  0) & 0x00003c3f;
404     const u32x d07 = (d >>  7) & 0x00003f03;
405     const u32x d21 = (d >> 21) & 0x0000000f;
406     const u32x d22 = (d >> 22) & 0x00000030;
407
408     u32x t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
409            | BOX (((d07 >>  0) & 0xff)
410                  |((d00 >>  8) & 0xff), 5, s_skb)
411            | BOX (((d07 >>  8) & 0xff), 6, s_skb)
412            | BOX (((d21 >>  0) & 0xff)
413                  |((d22 >>  0) & 0xff), 7, s_skb);
414
415     Kc[i] = ((t << 16) | (s & 0x0000ffff));
416     Kd[i] = ((s >> 16) | (t & 0xffff0000));
417   }
418 }
419
420 static void _des_crypt_encrypt (u32x iv[2], u32 mask, u32x Kc[16], u32x Kd[16], __local u32 (*s_SPtrans)[64])
421 {
422   const u32 E1 = (mask >> 2) & 0x3f0;
423   const u32 E0 = mask & 0x3f;
424
425   u32x r = 0;
426   u32x l = 0;
427
428   for (u32 i = 0; i < 25; i++)
429   {
430     for (u32 j = 0; j < 16; j += 2)
431     {
432       u32x t;
433       u32x u;
434
435       t = r ^ (r >> 16);
436       u = t & E0;
437       t = t & E1;
438       u = u ^ (u << 16);
439       u = u ^ r;
440       u = u ^ Kc[j + 0];
441       t = t ^ (t << 16);
442       t = t ^ r;
443       t = rotl32 (t, 28u);
444       t = t ^ Kd[j + 0];
445
446       l ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
447          | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
448          | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
449          | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
450          | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
451          | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
452          | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
453          | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
454
455       t = l ^ (l >> 16);
456       u = t & E0;
457       t = t & E1;
458       u = u ^ (u << 16);
459       u = u ^ l;
460       u = u ^ Kc[j + 1];
461       t = t ^ (t << 16);
462       t = t ^ l;
463       t = rotl32 (t, 28u);
464       t = t ^ Kd[j + 1];
465
466       r ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
467          | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
468          | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
469          | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
470          | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
471          | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
472          | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
473          | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
474     }
475
476     u32x tt;
477
478     tt = l;
479     l  = r;
480     r  = tt;
481   }
482
483   iv[0] = rotl32 (r, 31);
484   iv[1] = rotl32 (l, 31);
485 }
486
487 __kernel void m01500_m04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
488 {
489   /**
490    * modifier
491    */
492
493   const u32 gid = get_global_id (0);
494   const u32 lid = get_local_id (0);
495   const u32 lsz = get_local_size (0);
496
497   /**
498    * base
499    */
500
501   u32 pw_buf0[4];
502
503   pw_buf0[0] = pws[gid].i[ 0];
504   pw_buf0[1] = pws[gid].i[ 1];
505   pw_buf0[2] = 0;
506   pw_buf0[3] = 0;
507
508   u32 pw_buf1[4];
509
510   pw_buf1[0] = 0;
511   pw_buf1[1] = 0;
512   pw_buf1[2] = 0;
513   pw_buf1[3] = 0;
514
515   const u32 pw_len = pws[gid].pw_len;
516
517   /**
518    * sbox, kbox
519    */
520
521   __local u32 s_SPtrans[8][64];
522   __local u32 s_skb[8][64];
523
524   for (u32 i = lid; i < 64; i += lsz)
525   {
526     s_SPtrans[0][i] = c_SPtrans[0][i];
527     s_SPtrans[1][i] = c_SPtrans[1][i];
528     s_SPtrans[2][i] = c_SPtrans[2][i];
529     s_SPtrans[3][i] = c_SPtrans[3][i];
530     s_SPtrans[4][i] = c_SPtrans[4][i];
531     s_SPtrans[5][i] = c_SPtrans[5][i];
532     s_SPtrans[6][i] = c_SPtrans[6][i];
533     s_SPtrans[7][i] = c_SPtrans[7][i];
534
535     s_skb[0][i] = c_skb[0][i];
536     s_skb[1][i] = c_skb[1][i];
537     s_skb[2][i] = c_skb[2][i];
538     s_skb[3][i] = c_skb[3][i];
539     s_skb[4][i] = c_skb[4][i];
540     s_skb[5][i] = c_skb[5][i];
541     s_skb[6][i] = c_skb[6][i];
542     s_skb[7][i] = c_skb[7][i];
543   }
544
545   barrier (CLK_LOCAL_MEM_FENCE);
546
547   if (gid >= gid_max) return;
548
549   /**
550    * salt
551    */
552
553   const u32 mask = salt_bufs[salt_pos].salt_buf[0];
554
555   /**
556    * main
557    */
558
559   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
560   {
561     u32x w0[4] = { 0 };
562     u32x w1[4] = { 0 };
563     u32x w2[4] = { 0 };
564     u32x w3[4] = { 0 };
565
566     u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
567
568     out_len = (out_len >= 8) ? 8 : out_len;
569
570     u32x data[2];
571
572     data[0] = (w0[0] << 1) & 0xfefefefe;
573     data[1] = (w0[1] << 1) & 0xfefefefe;
574
575     u32x Kc[16];
576     u32x Kd[16];
577
578     _des_crypt_keysetup (data[0], data[1], Kc, Kd, s_skb);
579
580     u32x iv[2];
581
582     _des_crypt_encrypt (iv, mask, Kc, Kd, s_SPtrans);
583
584     u32x c = 0;
585     u32x d = 0;
586
587     COMPARE_M_SIMD (iv[0], iv[1], c, d);
588   }
589 }
590
591 __kernel void m01500_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
592 {
593 }
594
595 __kernel void m01500_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
596 {
597 }
598
599 __kernel void m01500_s04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
600 {
601   /**
602    * modifier
603    */
604
605   const u32 gid = get_global_id (0);
606   const u32 lid = get_local_id (0);
607   const u32 lsz = get_local_size (0);
608
609   /**
610    * base
611    */
612
613   u32 pw_buf0[4];
614
615   pw_buf0[0] = pws[gid].i[ 0];
616   pw_buf0[1] = pws[gid].i[ 1];
617   pw_buf0[2] = 0;
618   pw_buf0[3] = 0;
619
620   u32 pw_buf1[4];
621
622   pw_buf1[0] = 0;
623   pw_buf1[1] = 0;
624   pw_buf1[2] = 0;
625   pw_buf1[3] = 0;
626
627   const u32 pw_len = pws[gid].pw_len;
628
629   /**
630    * sbox, kbox
631    */
632
633   __local u32 s_SPtrans[8][64];
634   __local u32 s_skb[8][64];
635
636   for (u32 i = lid; i < 64; i += lsz)
637   {
638     s_SPtrans[0][i] = c_SPtrans[0][i];
639     s_SPtrans[1][i] = c_SPtrans[1][i];
640     s_SPtrans[2][i] = c_SPtrans[2][i];
641     s_SPtrans[3][i] = c_SPtrans[3][i];
642     s_SPtrans[4][i] = c_SPtrans[4][i];
643     s_SPtrans[5][i] = c_SPtrans[5][i];
644     s_SPtrans[6][i] = c_SPtrans[6][i];
645     s_SPtrans[7][i] = c_SPtrans[7][i];
646
647     s_skb[0][i] = c_skb[0][i];
648     s_skb[1][i] = c_skb[1][i];
649     s_skb[2][i] = c_skb[2][i];
650     s_skb[3][i] = c_skb[3][i];
651     s_skb[4][i] = c_skb[4][i];
652     s_skb[5][i] = c_skb[5][i];
653     s_skb[6][i] = c_skb[6][i];
654     s_skb[7][i] = c_skb[7][i];
655   }
656
657   barrier (CLK_LOCAL_MEM_FENCE);
658
659   if (gid >= gid_max) return;
660
661   /**
662    * salt
663    */
664
665   const u32 mask = salt_bufs[salt_pos].salt_buf[0];
666
667   /**
668    * digest
669    */
670
671   const u32 search[4] =
672   {
673     digests_buf[digests_offset].digest_buf[DGST_R0],
674     digests_buf[digests_offset].digest_buf[DGST_R1],
675     digests_buf[digests_offset].digest_buf[DGST_R2],
676     digests_buf[digests_offset].digest_buf[DGST_R3]
677   };
678
679   /**
680    * main
681    */
682
683   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
684   {
685     u32x w0[4] = { 0 };
686     u32x w1[4] = { 0 };
687     u32x w2[4] = { 0 };
688     u32x w3[4] = { 0 };
689
690     u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
691
692     out_len = (out_len >= 8) ? 8 : out_len;
693
694     u32x data[2];
695
696     data[0] = (w0[0] << 1) & 0xfefefefe;
697     data[1] = (w0[1] << 1) & 0xfefefefe;
698
699     u32x Kc[16];
700     u32x Kd[16];
701
702     _des_crypt_keysetup (data[0], data[1], Kc, Kd, s_skb);
703
704     u32x iv[2];
705
706     _des_crypt_encrypt (iv, mask, Kc, Kd, s_SPtrans);
707
708     u32x c = 0;
709     u32x d = 0;
710
711     COMPARE_S_SIMD (iv[0], iv[1], c, d);
712   }
713 }
714
715 __kernel void m01500_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
716 {
717 }
718
719 __kernel void m01500_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
720 {
721 }