- Added inline declaration to functions from simd.c, common.c, rp.c and types_ocl...
[hashcat.git] / OpenCL / m01500_a0.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *               magnum <john.magnum@hushmail.com>
5  *
6  * License.....: MIT
7  */
8
9 #define _DES_
10
11 #define NEW_SIMD_CODE
12
13 #include "include/constants.h"
14 #include "include/kernel_vendor.h"
15
16 #define DGST_R0 0
17 #define DGST_R1 1
18 #define DGST_R2 2
19 #define DGST_R3 3
20
21 #include "include/kernel_functions.c"
22 #include "OpenCL/types_ocl.c"
23 #include "OpenCL/common.c"
24 #include "include/rp_kernel.h"
25 #include "OpenCL/rp.c"
26 #include "OpenCL/simd.c"
27
28 #define PERM_OP(a,b,tt,n,m) \
29 {                           \
30   tt = a >> n;              \
31   tt = tt ^ b;              \
32   tt = tt & m;              \
33   b = b ^ tt;               \
34   tt = tt << n;             \
35   a = a ^ tt;               \
36 }
37
38 #define HPERM_OP(a,tt,n,m)  \
39 {                           \
40   tt = a << (16 + n);       \
41   tt = tt ^ a;              \
42   tt = tt & m;              \
43   a  = a ^ tt;              \
44   tt = tt >> (16 + n);      \
45   a  = a ^ tt;              \
46 }
47
48 __constant u32 c_SPtrans[8][64] =
49 {
50   {
51     0x00820200, 0x00020000, 0x80800000, 0x80820200,
52     0x00800000, 0x80020200, 0x80020000, 0x80800000,
53     0x80020200, 0x00820200, 0x00820000, 0x80000200,
54     0x80800200, 0x00800000, 0x00000000, 0x80020000,
55     0x00020000, 0x80000000, 0x00800200, 0x00020200,
56     0x80820200, 0x00820000, 0x80000200, 0x00800200,
57     0x80000000, 0x00000200, 0x00020200, 0x80820000,
58     0x00000200, 0x80800200, 0x80820000, 0x00000000,
59     0x00000000, 0x80820200, 0x00800200, 0x80020000,
60     0x00820200, 0x00020000, 0x80000200, 0x00800200,
61     0x80820000, 0x00000200, 0x00020200, 0x80800000,
62     0x80020200, 0x80000000, 0x80800000, 0x00820000,
63     0x80820200, 0x00020200, 0x00820000, 0x80800200,
64     0x00800000, 0x80000200, 0x80020000, 0x00000000,
65     0x00020000, 0x00800000, 0x80800200, 0x00820200,
66     0x80000000, 0x80820000, 0x00000200, 0x80020200,
67   },
68   {
69     0x10042004, 0x00000000, 0x00042000, 0x10040000,
70     0x10000004, 0x00002004, 0x10002000, 0x00042000,
71     0x00002000, 0x10040004, 0x00000004, 0x10002000,
72     0x00040004, 0x10042000, 0x10040000, 0x00000004,
73     0x00040000, 0x10002004, 0x10040004, 0x00002000,
74     0x00042004, 0x10000000, 0x00000000, 0x00040004,
75     0x10002004, 0x00042004, 0x10042000, 0x10000004,
76     0x10000000, 0x00040000, 0x00002004, 0x10042004,
77     0x00040004, 0x10042000, 0x10002000, 0x00042004,
78     0x10042004, 0x00040004, 0x10000004, 0x00000000,
79     0x10000000, 0x00002004, 0x00040000, 0x10040004,
80     0x00002000, 0x10000000, 0x00042004, 0x10002004,
81     0x10042000, 0x00002000, 0x00000000, 0x10000004,
82     0x00000004, 0x10042004, 0x00042000, 0x10040000,
83     0x10040004, 0x00040000, 0x00002004, 0x10002000,
84     0x10002004, 0x00000004, 0x10040000, 0x00042000,
85   },
86   {
87     0x41000000, 0x01010040, 0x00000040, 0x41000040,
88     0x40010000, 0x01000000, 0x41000040, 0x00010040,
89     0x01000040, 0x00010000, 0x01010000, 0x40000000,
90     0x41010040, 0x40000040, 0x40000000, 0x41010000,
91     0x00000000, 0x40010000, 0x01010040, 0x00000040,
92     0x40000040, 0x41010040, 0x00010000, 0x41000000,
93     0x41010000, 0x01000040, 0x40010040, 0x01010000,
94     0x00010040, 0x00000000, 0x01000000, 0x40010040,
95     0x01010040, 0x00000040, 0x40000000, 0x00010000,
96     0x40000040, 0x40010000, 0x01010000, 0x41000040,
97     0x00000000, 0x01010040, 0x00010040, 0x41010000,
98     0x40010000, 0x01000000, 0x41010040, 0x40000000,
99     0x40010040, 0x41000000, 0x01000000, 0x41010040,
100     0x00010000, 0x01000040, 0x41000040, 0x00010040,
101     0x01000040, 0x00000000, 0x41010000, 0x40000040,
102     0x41000000, 0x40010040, 0x00000040, 0x01010000,
103   },
104   {
105     0x00100402, 0x04000400, 0x00000002, 0x04100402,
106     0x00000000, 0x04100000, 0x04000402, 0x00100002,
107     0x04100400, 0x04000002, 0x04000000, 0x00000402,
108     0x04000002, 0x00100402, 0x00100000, 0x04000000,
109     0x04100002, 0x00100400, 0x00000400, 0x00000002,
110     0x00100400, 0x04000402, 0x04100000, 0x00000400,
111     0x00000402, 0x00000000, 0x00100002, 0x04100400,
112     0x04000400, 0x04100002, 0x04100402, 0x00100000,
113     0x04100002, 0x00000402, 0x00100000, 0x04000002,
114     0x00100400, 0x04000400, 0x00000002, 0x04100000,
115     0x04000402, 0x00000000, 0x00000400, 0x00100002,
116     0x00000000, 0x04100002, 0x04100400, 0x00000400,
117     0x04000000, 0x04100402, 0x00100402, 0x00100000,
118     0x04100402, 0x00000002, 0x04000400, 0x00100402,
119     0x00100002, 0x00100400, 0x04100000, 0x04000402,
120     0x00000402, 0x04000000, 0x04000002, 0x04100400,
121   },
122   {
123     0x02000000, 0x00004000, 0x00000100, 0x02004108,
124     0x02004008, 0x02000100, 0x00004108, 0x02004000,
125     0x00004000, 0x00000008, 0x02000008, 0x00004100,
126     0x02000108, 0x02004008, 0x02004100, 0x00000000,
127     0x00004100, 0x02000000, 0x00004008, 0x00000108,
128     0x02000100, 0x00004108, 0x00000000, 0x02000008,
129     0x00000008, 0x02000108, 0x02004108, 0x00004008,
130     0x02004000, 0x00000100, 0x00000108, 0x02004100,
131     0x02004100, 0x02000108, 0x00004008, 0x02004000,
132     0x00004000, 0x00000008, 0x02000008, 0x02000100,
133     0x02000000, 0x00004100, 0x02004108, 0x00000000,
134     0x00004108, 0x02000000, 0x00000100, 0x00004008,
135     0x02000108, 0x00000100, 0x00000000, 0x02004108,
136     0x02004008, 0x02004100, 0x00000108, 0x00004000,
137     0x00004100, 0x02004008, 0x02000100, 0x00000108,
138     0x00000008, 0x00004108, 0x02004000, 0x02000008,
139   },
140   {
141     0x20000010, 0x00080010, 0x00000000, 0x20080800,
142     0x00080010, 0x00000800, 0x20000810, 0x00080000,
143     0x00000810, 0x20080810, 0x00080800, 0x20000000,
144     0x20000800, 0x20000010, 0x20080000, 0x00080810,
145     0x00080000, 0x20000810, 0x20080010, 0x00000000,
146     0x00000800, 0x00000010, 0x20080800, 0x20080010,
147     0x20080810, 0x20080000, 0x20000000, 0x00000810,
148     0x00000010, 0x00080800, 0x00080810, 0x20000800,
149     0x00000810, 0x20000000, 0x20000800, 0x00080810,
150     0x20080800, 0x00080010, 0x00000000, 0x20000800,
151     0x20000000, 0x00000800, 0x20080010, 0x00080000,
152     0x00080010, 0x20080810, 0x00080800, 0x00000010,
153     0x20080810, 0x00080800, 0x00080000, 0x20000810,
154     0x20000010, 0x20080000, 0x00080810, 0x00000000,
155     0x00000800, 0x20000010, 0x20000810, 0x20080800,
156     0x20080000, 0x00000810, 0x00000010, 0x20080010,
157   },
158   {
159     0x00001000, 0x00000080, 0x00400080, 0x00400001,
160     0x00401081, 0x00001001, 0x00001080, 0x00000000,
161     0x00400000, 0x00400081, 0x00000081, 0x00401000,
162     0x00000001, 0x00401080, 0x00401000, 0x00000081,
163     0x00400081, 0x00001000, 0x00001001, 0x00401081,
164     0x00000000, 0x00400080, 0x00400001, 0x00001080,
165     0x00401001, 0x00001081, 0x00401080, 0x00000001,
166     0x00001081, 0x00401001, 0x00000080, 0x00400000,
167     0x00001081, 0x00401000, 0x00401001, 0x00000081,
168     0x00001000, 0x00000080, 0x00400000, 0x00401001,
169     0x00400081, 0x00001081, 0x00001080, 0x00000000,
170     0x00000080, 0x00400001, 0x00000001, 0x00400080,
171     0x00000000, 0x00400081, 0x00400080, 0x00001080,
172     0x00000081, 0x00001000, 0x00401081, 0x00400000,
173     0x00401080, 0x00000001, 0x00001001, 0x00401081,
174     0x00400001, 0x00401080, 0x00401000, 0x00001001,
175   },
176   {
177     0x08200020, 0x08208000, 0x00008020, 0x00000000,
178     0x08008000, 0x00200020, 0x08200000, 0x08208020,
179     0x00000020, 0x08000000, 0x00208000, 0x00008020,
180     0x00208020, 0x08008020, 0x08000020, 0x08200000,
181     0x00008000, 0x00208020, 0x00200020, 0x08008000,
182     0x08208020, 0x08000020, 0x00000000, 0x00208000,
183     0x08000000, 0x00200000, 0x08008020, 0x08200020,
184     0x00200000, 0x00008000, 0x08208000, 0x00000020,
185     0x00200000, 0x00008000, 0x08000020, 0x08208020,
186     0x00008020, 0x08000000, 0x00000000, 0x00208000,
187     0x08200020, 0x08008020, 0x08008000, 0x00200020,
188     0x08208000, 0x00000020, 0x00200020, 0x08008000,
189     0x08208020, 0x00200000, 0x08200000, 0x08000020,
190     0x00208000, 0x00008020, 0x08008020, 0x08200000,
191     0x00000020, 0x08208000, 0x00208020, 0x00000000,
192     0x08000000, 0x08200020, 0x00008000, 0x00208020
193   },
194 };
195
196 __constant u32 c_skb[8][64] =
197 {
198   {
199     0x00000000, 0x00000010, 0x20000000, 0x20000010,
200     0x00010000, 0x00010010, 0x20010000, 0x20010010,
201     0x00000800, 0x00000810, 0x20000800, 0x20000810,
202     0x00010800, 0x00010810, 0x20010800, 0x20010810,
203     0x00000020, 0x00000030, 0x20000020, 0x20000030,
204     0x00010020, 0x00010030, 0x20010020, 0x20010030,
205     0x00000820, 0x00000830, 0x20000820, 0x20000830,
206     0x00010820, 0x00010830, 0x20010820, 0x20010830,
207     0x00080000, 0x00080010, 0x20080000, 0x20080010,
208     0x00090000, 0x00090010, 0x20090000, 0x20090010,
209     0x00080800, 0x00080810, 0x20080800, 0x20080810,
210     0x00090800, 0x00090810, 0x20090800, 0x20090810,
211     0x00080020, 0x00080030, 0x20080020, 0x20080030,
212     0x00090020, 0x00090030, 0x20090020, 0x20090030,
213     0x00080820, 0x00080830, 0x20080820, 0x20080830,
214     0x00090820, 0x00090830, 0x20090820, 0x20090830,
215   },
216   {
217     0x00000000, 0x02000000, 0x00002000, 0x02002000,
218     0x00200000, 0x02200000, 0x00202000, 0x02202000,
219     0x00000004, 0x02000004, 0x00002004, 0x02002004,
220     0x00200004, 0x02200004, 0x00202004, 0x02202004,
221     0x00000400, 0x02000400, 0x00002400, 0x02002400,
222     0x00200400, 0x02200400, 0x00202400, 0x02202400,
223     0x00000404, 0x02000404, 0x00002404, 0x02002404,
224     0x00200404, 0x02200404, 0x00202404, 0x02202404,
225     0x10000000, 0x12000000, 0x10002000, 0x12002000,
226     0x10200000, 0x12200000, 0x10202000, 0x12202000,
227     0x10000004, 0x12000004, 0x10002004, 0x12002004,
228     0x10200004, 0x12200004, 0x10202004, 0x12202004,
229     0x10000400, 0x12000400, 0x10002400, 0x12002400,
230     0x10200400, 0x12200400, 0x10202400, 0x12202400,
231     0x10000404, 0x12000404, 0x10002404, 0x12002404,
232     0x10200404, 0x12200404, 0x10202404, 0x12202404,
233   },
234   {
235     0x00000000, 0x00000001, 0x00040000, 0x00040001,
236     0x01000000, 0x01000001, 0x01040000, 0x01040001,
237     0x00000002, 0x00000003, 0x00040002, 0x00040003,
238     0x01000002, 0x01000003, 0x01040002, 0x01040003,
239     0x00000200, 0x00000201, 0x00040200, 0x00040201,
240     0x01000200, 0x01000201, 0x01040200, 0x01040201,
241     0x00000202, 0x00000203, 0x00040202, 0x00040203,
242     0x01000202, 0x01000203, 0x01040202, 0x01040203,
243     0x08000000, 0x08000001, 0x08040000, 0x08040001,
244     0x09000000, 0x09000001, 0x09040000, 0x09040001,
245     0x08000002, 0x08000003, 0x08040002, 0x08040003,
246     0x09000002, 0x09000003, 0x09040002, 0x09040003,
247     0x08000200, 0x08000201, 0x08040200, 0x08040201,
248     0x09000200, 0x09000201, 0x09040200, 0x09040201,
249     0x08000202, 0x08000203, 0x08040202, 0x08040203,
250     0x09000202, 0x09000203, 0x09040202, 0x09040203,
251   },
252   {
253     0x00000000, 0x00100000, 0x00000100, 0x00100100,
254     0x00000008, 0x00100008, 0x00000108, 0x00100108,
255     0x00001000, 0x00101000, 0x00001100, 0x00101100,
256     0x00001008, 0x00101008, 0x00001108, 0x00101108,
257     0x04000000, 0x04100000, 0x04000100, 0x04100100,
258     0x04000008, 0x04100008, 0x04000108, 0x04100108,
259     0x04001000, 0x04101000, 0x04001100, 0x04101100,
260     0x04001008, 0x04101008, 0x04001108, 0x04101108,
261     0x00020000, 0x00120000, 0x00020100, 0x00120100,
262     0x00020008, 0x00120008, 0x00020108, 0x00120108,
263     0x00021000, 0x00121000, 0x00021100, 0x00121100,
264     0x00021008, 0x00121008, 0x00021108, 0x00121108,
265     0x04020000, 0x04120000, 0x04020100, 0x04120100,
266     0x04020008, 0x04120008, 0x04020108, 0x04120108,
267     0x04021000, 0x04121000, 0x04021100, 0x04121100,
268     0x04021008, 0x04121008, 0x04021108, 0x04121108,
269   },
270   {
271     0x00000000, 0x10000000, 0x00010000, 0x10010000,
272     0x00000004, 0x10000004, 0x00010004, 0x10010004,
273     0x20000000, 0x30000000, 0x20010000, 0x30010000,
274     0x20000004, 0x30000004, 0x20010004, 0x30010004,
275     0x00100000, 0x10100000, 0x00110000, 0x10110000,
276     0x00100004, 0x10100004, 0x00110004, 0x10110004,
277     0x20100000, 0x30100000, 0x20110000, 0x30110000,
278     0x20100004, 0x30100004, 0x20110004, 0x30110004,
279     0x00001000, 0x10001000, 0x00011000, 0x10011000,
280     0x00001004, 0x10001004, 0x00011004, 0x10011004,
281     0x20001000, 0x30001000, 0x20011000, 0x30011000,
282     0x20001004, 0x30001004, 0x20011004, 0x30011004,
283     0x00101000, 0x10101000, 0x00111000, 0x10111000,
284     0x00101004, 0x10101004, 0x00111004, 0x10111004,
285     0x20101000, 0x30101000, 0x20111000, 0x30111000,
286     0x20101004, 0x30101004, 0x20111004, 0x30111004,
287   },
288   {
289     0x00000000, 0x08000000, 0x00000008, 0x08000008,
290     0x00000400, 0x08000400, 0x00000408, 0x08000408,
291     0x00020000, 0x08020000, 0x00020008, 0x08020008,
292     0x00020400, 0x08020400, 0x00020408, 0x08020408,
293     0x00000001, 0x08000001, 0x00000009, 0x08000009,
294     0x00000401, 0x08000401, 0x00000409, 0x08000409,
295     0x00020001, 0x08020001, 0x00020009, 0x08020009,
296     0x00020401, 0x08020401, 0x00020409, 0x08020409,
297     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
298     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
299     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
300     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
301     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
302     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
303     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
304     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
305   },
306   {
307     0x00000000, 0x00000100, 0x00080000, 0x00080100,
308     0x01000000, 0x01000100, 0x01080000, 0x01080100,
309     0x00000010, 0x00000110, 0x00080010, 0x00080110,
310     0x01000010, 0x01000110, 0x01080010, 0x01080110,
311     0x00200000, 0x00200100, 0x00280000, 0x00280100,
312     0x01200000, 0x01200100, 0x01280000, 0x01280100,
313     0x00200010, 0x00200110, 0x00280010, 0x00280110,
314     0x01200010, 0x01200110, 0x01280010, 0x01280110,
315     0x00000200, 0x00000300, 0x00080200, 0x00080300,
316     0x01000200, 0x01000300, 0x01080200, 0x01080300,
317     0x00000210, 0x00000310, 0x00080210, 0x00080310,
318     0x01000210, 0x01000310, 0x01080210, 0x01080310,
319     0x00200200, 0x00200300, 0x00280200, 0x00280300,
320     0x01200200, 0x01200300, 0x01280200, 0x01280300,
321     0x00200210, 0x00200310, 0x00280210, 0x00280310,
322     0x01200210, 0x01200310, 0x01280210, 0x01280310,
323   },
324   {
325     0x00000000, 0x04000000, 0x00040000, 0x04040000,
326     0x00000002, 0x04000002, 0x00040002, 0x04040002,
327     0x00002000, 0x04002000, 0x00042000, 0x04042000,
328     0x00002002, 0x04002002, 0x00042002, 0x04042002,
329     0x00000020, 0x04000020, 0x00040020, 0x04040020,
330     0x00000022, 0x04000022, 0x00040022, 0x04040022,
331     0x00002020, 0x04002020, 0x00042020, 0x04042020,
332     0x00002022, 0x04002022, 0x00042022, 0x04042022,
333     0x00000800, 0x04000800, 0x00040800, 0x04040800,
334     0x00000802, 0x04000802, 0x00040802, 0x04040802,
335     0x00002800, 0x04002800, 0x00042800, 0x04042800,
336     0x00002802, 0x04002802, 0x00042802, 0x04042802,
337     0x00000820, 0x04000820, 0x00040820, 0x04040820,
338     0x00000822, 0x04000822, 0x00040822, 0x04040822,
339     0x00002820, 0x04002820, 0x00042820, 0x04042820,
340     0x00002822, 0x04002822, 0x00042822, 0x04042822
341   },
342 };
343
344 #if   VECT_SIZE == 1
345 #define BOX(i,n,S) (S)[(n)][(i)]
346 #elif VECT_SIZE == 2
347 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1])
348 #elif VECT_SIZE == 4
349 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3])
350 #elif VECT_SIZE == 8
351 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7])
352 #elif VECT_SIZE == 16
353 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7], (S)[(n)][(i).s8], (S)[(n)][(i).s9], (S)[(n)][(i).sa], (S)[(n)][(i).sb], (S)[(n)][(i).sc], (S)[(n)][(i).sd], (S)[(n)][(i).se], (S)[(n)][(i).sf])
354 #endif
355
356 void _des_crypt_keysetup (u32x c, u32x d, u32x Kc[16], u32x Kd[16], __local u32 (*s_skb)[64])
357 {
358   u32x tt;
359
360   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
361   HPERM_OP (c,    tt, 2, 0xcccc0000);
362   HPERM_OP (d,    tt, 2, 0xcccc0000);
363   PERM_OP  (d, c, tt, 1, 0x55555555);
364   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
365   PERM_OP  (d, c, tt, 1, 0x55555555);
366
367   d = ((d & 0x000000ff) << 16)
368     | ((d & 0x0000ff00) <<  0)
369     | ((d & 0x00ff0000) >> 16)
370     | ((c & 0xf0000000) >>  4);
371
372   c = c & 0x0fffffff;
373
374   #pragma unroll 16
375   for (u32 i = 0; i < 16; i++)
376   {
377     if ((i < 2) || (i == 8) || (i == 15))
378     {
379       c = ((c >> 1) | (c << 27));
380       d = ((d >> 1) | (d << 27));
381     }
382     else
383     {
384       c = ((c >> 2) | (c << 26));
385       d = ((d >> 2) | (d << 26));
386     }
387
388     c = c & 0x0fffffff;
389     d = d & 0x0fffffff;
390
391     const u32x c00 = (c >>  0) & 0x0000003f;
392     const u32x c06 = (c >>  6) & 0x00383003;
393     const u32x c07 = (c >>  7) & 0x0000003c;
394     const u32x c13 = (c >> 13) & 0x0000060f;
395     const u32x c20 = (c >> 20) & 0x00000001;
396
397     u32x s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
398            | BOX (((c06 >>  0) & 0xff)
399                  |((c07 >>  0) & 0xff), 1, s_skb)
400            | BOX (((c13 >>  0) & 0xff)
401                  |((c06 >>  8) & 0xff), 2, s_skb)
402            | BOX (((c20 >>  0) & 0xff)
403                  |((c13 >>  8) & 0xff)
404                  |((c06 >> 16) & 0xff), 3, s_skb);
405
406     const u32x d00 = (d >>  0) & 0x00003c3f;
407     const u32x d07 = (d >>  7) & 0x00003f03;
408     const u32x d21 = (d >> 21) & 0x0000000f;
409     const u32x d22 = (d >> 22) & 0x00000030;
410
411     u32x t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
412            | BOX (((d07 >>  0) & 0xff)
413                  |((d00 >>  8) & 0xff), 5, s_skb)
414            | BOX (((d07 >>  8) & 0xff), 6, s_skb)
415            | BOX (((d21 >>  0) & 0xff)
416                  |((d22 >>  0) & 0xff), 7, s_skb);
417
418     Kc[i] = ((t << 16) | (s & 0x0000ffff));
419     Kd[i] = ((s >> 16) | (t & 0xffff0000));
420   }
421 }
422
423 void _des_crypt_encrypt (u32x iv[2], u32 mask, u32x Kc[16], u32x Kd[16], __local u32 (*s_SPtrans)[64])
424 {
425   const u32 E1 = (mask >> 2) & 0x3f0;
426   const u32 E0 = mask & 0x3f;
427
428   u32x r = 0;
429   u32x l = 0;
430
431   for (u32 i = 0; i < 25; i++)
432   {
433     for (u32 j = 0; j < 16; j += 2)
434     {
435       u32x t;
436       u32x u;
437
438       t = r ^ (r >> 16);
439       u = t & E0;
440       t = t & E1;
441       u = u ^ (u << 16);
442       u = u ^ r;
443       u = u ^ Kc[j + 0];
444       t = t ^ (t << 16);
445       t = t ^ r;
446       t = rotl32 (t, 28u);
447       t = t ^ Kd[j + 0];
448
449       l ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
450          | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
451          | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
452          | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
453          | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
454          | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
455          | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
456          | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
457
458       t = l ^ (l >> 16);
459       u = t & E0;
460       t = t & E1;
461       u = u ^ (u << 16);
462       u = u ^ l;
463       u = u ^ Kc[j + 1];
464       t = t ^ (t << 16);
465       t = t ^ l;
466       t = rotl32 (t, 28u);
467       t = t ^ Kd[j + 1];
468
469       r ^= BOX (((u >>  0) & 0x3f), 0, s_SPtrans)
470          | BOX (((u >>  8) & 0x3f), 2, s_SPtrans)
471          | BOX (((u >> 16) & 0x3f), 4, s_SPtrans)
472          | BOX (((u >> 24) & 0x3f), 6, s_SPtrans)
473          | BOX (((t >>  0) & 0x3f), 1, s_SPtrans)
474          | BOX (((t >>  8) & 0x3f), 3, s_SPtrans)
475          | BOX (((t >> 16) & 0x3f), 5, s_SPtrans)
476          | BOX (((t >> 24) & 0x3f), 7, s_SPtrans);
477     }
478
479     u32x tt;
480
481     tt = l;
482     l  = r;
483     r  = tt;
484   }
485
486   iv[0] = rotl32 (r, 31);
487   iv[1] = rotl32 (l, 31);
488 }
489
490 __kernel void m01500_m04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
491 {
492   /**
493    * modifier
494    */
495
496   const u32 gid = get_global_id (0);
497   const u32 lid = get_local_id (0);
498   const u32 lsz = get_local_size (0);
499
500   /**
501    * sbox, kbox
502    */
503
504   __local u32 s_SPtrans[8][64];
505   __local u32 s_skb[8][64];
506
507   for (u32 i = lid; i < 64; i += lsz)
508   {
509     s_SPtrans[0][i] = c_SPtrans[0][i];
510     s_SPtrans[1][i] = c_SPtrans[1][i];
511     s_SPtrans[2][i] = c_SPtrans[2][i];
512     s_SPtrans[3][i] = c_SPtrans[3][i];
513     s_SPtrans[4][i] = c_SPtrans[4][i];
514     s_SPtrans[5][i] = c_SPtrans[5][i];
515     s_SPtrans[6][i] = c_SPtrans[6][i];
516     s_SPtrans[7][i] = c_SPtrans[7][i];
517
518     s_skb[0][i] = c_skb[0][i];
519     s_skb[1][i] = c_skb[1][i];
520     s_skb[2][i] = c_skb[2][i];
521     s_skb[3][i] = c_skb[3][i];
522     s_skb[4][i] = c_skb[4][i];
523     s_skb[5][i] = c_skb[5][i];
524     s_skb[6][i] = c_skb[6][i];
525     s_skb[7][i] = c_skb[7][i];
526   }
527
528   barrier (CLK_LOCAL_MEM_FENCE);
529
530   if (gid >= gid_max) return;
531
532   /**
533    * base
534    */
535
536   u32 pw_buf0[4];
537   u32 pw_buf1[4];
538
539   pw_buf0[0] = pws[gid].i[0];
540   pw_buf0[1] = pws[gid].i[1];
541   pw_buf0[2] = pws[gid].i[2];
542   pw_buf0[3] = pws[gid].i[3];
543   pw_buf1[0] = pws[gid].i[4];
544   pw_buf1[1] = pws[gid].i[5];
545   pw_buf1[2] = pws[gid].i[6];
546   pw_buf1[3] = pws[gid].i[7];
547
548   const u32 pw_len = pws[gid].pw_len;
549
550   /**
551    * salt
552    */
553
554   const u32 mask = salt_bufs[salt_pos].salt_buf[0];
555
556   /**
557    * main
558    */
559
560   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
561   {
562     u32x w0[4] = { 0 };
563     u32x w1[4] = { 0 };
564     u32x w2[4] = { 0 };
565     u32x w3[4] = { 0 };
566
567     const u32x out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
568
569     u32x data[2];
570
571     data[0] = (w0[0] << 1) & 0xfefefefe;
572     data[1] = (w0[1] << 1) & 0xfefefefe;
573
574     u32x Kc[16];
575     u32x Kd[16];
576
577     _des_crypt_keysetup (data[0], data[1], Kc, Kd, s_skb);
578
579     u32x iv[2];
580
581     _des_crypt_encrypt (iv, mask, Kc, Kd, s_SPtrans);
582
583     u32x c = 0;
584     u32x d = 0;
585
586     COMPARE_M_SIMD (iv[0], iv[1], c, d);
587   }
588 }
589
590 __kernel void m01500_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
591 {
592 }
593
594 __kernel void m01500_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
595 {
596 }
597
598 __kernel void m01500_s04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
599 {
600   /**
601    * modifier
602    */
603
604   const u32 gid = get_global_id (0);
605   const u32 lid = get_local_id (0);
606   const u32 lsz = get_local_size (0);
607
608   /**
609    * sbox, kbox
610    */
611
612   __local u32 s_SPtrans[8][64];
613   __local u32 s_skb[8][64];
614
615   for (u32 i = lid; i < 64; i += lsz)
616   {
617     s_SPtrans[0][i] = c_SPtrans[0][i];
618     s_SPtrans[1][i] = c_SPtrans[1][i];
619     s_SPtrans[2][i] = c_SPtrans[2][i];
620     s_SPtrans[3][i] = c_SPtrans[3][i];
621     s_SPtrans[4][i] = c_SPtrans[4][i];
622     s_SPtrans[5][i] = c_SPtrans[5][i];
623     s_SPtrans[6][i] = c_SPtrans[6][i];
624     s_SPtrans[7][i] = c_SPtrans[7][i];
625
626     s_skb[0][i] = c_skb[0][i];
627     s_skb[1][i] = c_skb[1][i];
628     s_skb[2][i] = c_skb[2][i];
629     s_skb[3][i] = c_skb[3][i];
630     s_skb[4][i] = c_skb[4][i];
631     s_skb[5][i] = c_skb[5][i];
632     s_skb[6][i] = c_skb[6][i];
633     s_skb[7][i] = c_skb[7][i];
634   }
635
636   barrier (CLK_LOCAL_MEM_FENCE);
637
638   if (gid >= gid_max) return;
639
640   /**
641    * base
642    */
643
644   u32 pw_buf0[4];
645   u32 pw_buf1[4];
646
647   pw_buf0[0] = pws[gid].i[0];
648   pw_buf0[1] = pws[gid].i[1];
649   pw_buf0[2] = pws[gid].i[2];
650   pw_buf0[3] = pws[gid].i[3];
651   pw_buf1[0] = pws[gid].i[4];
652   pw_buf1[1] = pws[gid].i[5];
653   pw_buf1[2] = pws[gid].i[6];
654   pw_buf1[3] = pws[gid].i[7];
655
656   const u32 pw_len = pws[gid].pw_len;
657
658   /**
659    * salt
660    */
661
662   const u32 mask = salt_bufs[salt_pos].salt_buf[0];
663
664   /**
665    * digest
666    */
667
668   const u32 search[4] =
669   {
670     digests_buf[digests_offset].digest_buf[DGST_R0],
671     digests_buf[digests_offset].digest_buf[DGST_R1],
672     digests_buf[digests_offset].digest_buf[DGST_R2],
673     digests_buf[digests_offset].digest_buf[DGST_R3]
674   };
675
676   /**
677    * main
678    */
679
680   for (u32 il_pos = 0; il_pos < il_cnt; il_pos += VECT_SIZE)
681   {
682     u32x w0[4] = { 0 };
683     u32x w1[4] = { 0 };
684     u32x w2[4] = { 0 };
685     u32x w3[4] = { 0 };
686
687     const u32x out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
688
689     u32x data[2];
690
691     data[0] = (w0[0] << 1) & 0xfefefefe;
692     data[1] = (w0[1] << 1) & 0xfefefefe;
693
694     u32x Kc[16];
695     u32x Kd[16];
696
697     _des_crypt_keysetup (data[0], data[1], Kc, Kd, s_skb);
698
699     u32x iv[2];
700
701     _des_crypt_encrypt (iv, mask, Kc, Kd, s_SPtrans);
702
703     u32x c = 0;
704     u32x d = 0;
705
706     COMPARE_S_SIMD (iv[0], iv[1], c, d);
707   }
708 }
709
710 __kernel void m01500_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
711 {
712 }
713
714 __kernel void m01500_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 il_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
715 {
716 }