Prepare _a0 kernel for SIMD
[hashcat.git] / OpenCL / m08500_a0.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _DES_
9
10 #include "include/constants.h"
11 #include "include/kernel_vendor.h"
12
13 #define DGST_R0 0
14 #define DGST_R1 1
15 #define DGST_R2 2
16 #define DGST_R3 3
17
18 #include "include/kernel_functions.c"
19 #include "OpenCL/types_ocl.c"
20 #include "OpenCL/common.c"
21 #include "include/rp_kernel.h"
22 #include "OpenCL/rp.c"
23
24 #define COMPARE_S "OpenCL/check_single_comp4.c"
25 #define COMPARE_M "OpenCL/check_multi_comp4.c"
26
27 #define PERM_OP(a,b,tt,n,m) \
28 {                           \
29   tt = a >> n;              \
30   tt = tt ^ b;              \
31   tt = tt & m;              \
32   b = b ^ tt;               \
33   tt = tt << n;             \
34   a = a ^ tt;               \
35 }
36
37 #define HPERM_OP(a,tt,n,m)  \
38 {                           \
39   tt = a << (16 + n);       \
40   tt = tt ^ a;              \
41   tt = tt & m;              \
42   a  = a ^ tt;              \
43   tt = tt >> (16 + n);      \
44   a  = a ^ tt;              \
45 }
46
47 #define IP(l,r,tt)                     \
48 {                                      \
49   PERM_OP (r, l, tt,  4, 0x0f0f0f0f);  \
50   PERM_OP (l, r, tt, 16, 0x0000ffff);  \
51   PERM_OP (r, l, tt,  2, 0x33333333);  \
52   PERM_OP (l, r, tt,  8, 0x00ff00ff);  \
53   PERM_OP (r, l, tt,  1, 0x55555555);  \
54 }
55
56 #define FP(l,r,tt)                     \
57 {                                      \
58   PERM_OP (l, r, tt,  1, 0x55555555);  \
59   PERM_OP (r, l, tt,  8, 0x00ff00ff);  \
60   PERM_OP (l, r, tt,  2, 0x33333333);  \
61   PERM_OP (r, l, tt, 16, 0x0000ffff);  \
62   PERM_OP (l, r, tt,  4, 0x0f0f0f0f);  \
63 }
64
65 __constant u8 ascii_to_ebcdic_pc[256] =
66 {
67   // little hack, can't crack 0-bytes in password, but who cares
68   //    0xab, 0xa8, 0xae, 0xad, 0xc4, 0xf1, 0xf7, 0xf4, 0x86, 0xa1, 0xe0, 0xbc, 0xb3, 0xb0, 0xb6, 0xb5,
69   0x2a, 0xa8, 0xae, 0xad, 0xc4, 0xf1, 0xf7, 0xf4, 0x86, 0xa1, 0xe0, 0xbc, 0xb3, 0xb0, 0xb6, 0xb5,
70   0x8a, 0x89, 0x8f, 0x8c, 0xd3, 0xd0, 0xce, 0xe6, 0x9b, 0x98, 0xd5, 0xe5, 0x92, 0x91, 0x97, 0x94,
71   0x2a, 0x34, 0x54, 0x5d, 0x1c, 0x73, 0x0b, 0x51, 0x31, 0x10, 0x13, 0x37, 0x7c, 0x6b, 0x3d, 0x68,
72   0x4a, 0x49, 0x4f, 0x4c, 0x43, 0x40, 0x46, 0x45, 0x5b, 0x58, 0x5e, 0x16, 0x32, 0x57, 0x76, 0x75,
73   0x52, 0x29, 0x2f, 0x2c, 0x23, 0x20, 0x26, 0x25, 0x3b, 0x38, 0x08, 0x0e, 0x0d, 0x02, 0x01, 0x07,
74   0x04, 0x1a, 0x19, 0x6e, 0x6d, 0x62, 0x61, 0x67, 0x64, 0x7a, 0x79, 0x3e, 0x6b, 0x1f, 0x15, 0x70,
75   0x58, 0xa8, 0xae, 0xad, 0xa2, 0xa1, 0xa7, 0xa4, 0xba, 0xb9, 0x89, 0x8f, 0x8c, 0x83, 0x80, 0x86,
76   0x85, 0x9b, 0x98, 0xef, 0xec, 0xe3, 0xe0, 0xe6, 0xe5, 0xfb, 0xf8, 0x2a, 0x7f, 0x0b, 0xe9, 0xa4,
77   0xea, 0xe9, 0xef, 0xec, 0xe3, 0x80, 0xa7, 0x85, 0xfb, 0xf8, 0xfe, 0xfd, 0xf2, 0xb9, 0xbf, 0x9d,
78   0xcb, 0xc8, 0x9e, 0xcd, 0xc2, 0xc1, 0xc7, 0xba, 0xda, 0xd9, 0xdf, 0xdc, 0xa2, 0x83, 0xd6, 0x68,
79   0x29, 0x2f, 0x2c, 0x23, 0x20, 0x26, 0x25, 0x3b, 0x38, 0x08, 0x0e, 0x0d, 0x02, 0x01, 0x07, 0x04,
80   0x1a, 0x19, 0x6e, 0x6d, 0x62, 0x61, 0x67, 0x64, 0x7a, 0x79, 0x4a, 0x49, 0x4f, 0x4c, 0x43, 0x40,
81   0x46, 0x45, 0x5b, 0xab, 0xbf, 0xbc, 0xb3, 0xb0, 0xb6, 0xb5, 0x8a, 0x9e, 0x9d, 0x92, 0x91, 0x97,
82   0x94, 0xea, 0xfe, 0xfd, 0xf2, 0xf1, 0xf7, 0xf4, 0xcb, 0xc8, 0xce, 0xcd, 0xc2, 0xc1, 0xc7, 0xc4,
83   0xda, 0xd9, 0xdf, 0xdc, 0xd3, 0xd0, 0xd6, 0xd5, 0x3e, 0x3d, 0x32, 0x31, 0x37, 0x34, 0x1f, 0x1c,
84   0x13, 0x10, 0x16, 0x15, 0x7f, 0x7c, 0x73, 0x70, 0x76, 0x75, 0x5e, 0x5d, 0x52, 0x51, 0x57, 0x54,
85 };
86
87 __constant u32 c_SPtrans[8][64] =
88 {
89   {
90     0x02080800, 0x00080000, 0x02000002, 0x02080802,
91     0x02000000, 0x00080802, 0x00080002, 0x02000002,
92     0x00080802, 0x02080800, 0x02080000, 0x00000802,
93     0x02000802, 0x02000000, 0x00000000, 0x00080002,
94     0x00080000, 0x00000002, 0x02000800, 0x00080800,
95     0x02080802, 0x02080000, 0x00000802, 0x02000800,
96     0x00000002, 0x00000800, 0x00080800, 0x02080002,
97     0x00000800, 0x02000802, 0x02080002, 0x00000000,
98     0x00000000, 0x02080802, 0x02000800, 0x00080002,
99     0x02080800, 0x00080000, 0x00000802, 0x02000800,
100     0x02080002, 0x00000800, 0x00080800, 0x02000002,
101     0x00080802, 0x00000002, 0x02000002, 0x02080000,
102     0x02080802, 0x00080800, 0x02080000, 0x02000802,
103     0x02000000, 0x00000802, 0x00080002, 0x00000000,
104     0x00080000, 0x02000000, 0x02000802, 0x02080800,
105     0x00000002, 0x02080002, 0x00000800, 0x00080802,
106   },
107   {
108     0x40108010, 0x00000000, 0x00108000, 0x40100000,
109     0x40000010, 0x00008010, 0x40008000, 0x00108000,
110     0x00008000, 0x40100010, 0x00000010, 0x40008000,
111     0x00100010, 0x40108000, 0x40100000, 0x00000010,
112     0x00100000, 0x40008010, 0x40100010, 0x00008000,
113     0x00108010, 0x40000000, 0x00000000, 0x00100010,
114     0x40008010, 0x00108010, 0x40108000, 0x40000010,
115     0x40000000, 0x00100000, 0x00008010, 0x40108010,
116     0x00100010, 0x40108000, 0x40008000, 0x00108010,
117     0x40108010, 0x00100010, 0x40000010, 0x00000000,
118     0x40000000, 0x00008010, 0x00100000, 0x40100010,
119     0x00008000, 0x40000000, 0x00108010, 0x40008010,
120     0x40108000, 0x00008000, 0x00000000, 0x40000010,
121     0x00000010, 0x40108010, 0x00108000, 0x40100000,
122     0x40100010, 0x00100000, 0x00008010, 0x40008000,
123     0x40008010, 0x00000010, 0x40100000, 0x00108000,
124   },
125   {
126     0x04000001, 0x04040100, 0x00000100, 0x04000101,
127     0x00040001, 0x04000000, 0x04000101, 0x00040100,
128     0x04000100, 0x00040000, 0x04040000, 0x00000001,
129     0x04040101, 0x00000101, 0x00000001, 0x04040001,
130     0x00000000, 0x00040001, 0x04040100, 0x00000100,
131     0x00000101, 0x04040101, 0x00040000, 0x04000001,
132     0x04040001, 0x04000100, 0x00040101, 0x04040000,
133     0x00040100, 0x00000000, 0x04000000, 0x00040101,
134     0x04040100, 0x00000100, 0x00000001, 0x00040000,
135     0x00000101, 0x00040001, 0x04040000, 0x04000101,
136     0x00000000, 0x04040100, 0x00040100, 0x04040001,
137     0x00040001, 0x04000000, 0x04040101, 0x00000001,
138     0x00040101, 0x04000001, 0x04000000, 0x04040101,
139     0x00040000, 0x04000100, 0x04000101, 0x00040100,
140     0x04000100, 0x00000000, 0x04040001, 0x00000101,
141     0x04000001, 0x00040101, 0x00000100, 0x04040000,
142   },
143   {
144     0x00401008, 0x10001000, 0x00000008, 0x10401008,
145     0x00000000, 0x10400000, 0x10001008, 0x00400008,
146     0x10401000, 0x10000008, 0x10000000, 0x00001008,
147     0x10000008, 0x00401008, 0x00400000, 0x10000000,
148     0x10400008, 0x00401000, 0x00001000, 0x00000008,
149     0x00401000, 0x10001008, 0x10400000, 0x00001000,
150     0x00001008, 0x00000000, 0x00400008, 0x10401000,
151     0x10001000, 0x10400008, 0x10401008, 0x00400000,
152     0x10400008, 0x00001008, 0x00400000, 0x10000008,
153     0x00401000, 0x10001000, 0x00000008, 0x10400000,
154     0x10001008, 0x00000000, 0x00001000, 0x00400008,
155     0x00000000, 0x10400008, 0x10401000, 0x00001000,
156     0x10000000, 0x10401008, 0x00401008, 0x00400000,
157     0x10401008, 0x00000008, 0x10001000, 0x00401008,
158     0x00400008, 0x00401000, 0x10400000, 0x10001008,
159     0x00001008, 0x10000000, 0x10000008, 0x10401000,
160   },
161   {
162     0x08000000, 0x00010000, 0x00000400, 0x08010420,
163     0x08010020, 0x08000400, 0x00010420, 0x08010000,
164     0x00010000, 0x00000020, 0x08000020, 0x00010400,
165     0x08000420, 0x08010020, 0x08010400, 0x00000000,
166     0x00010400, 0x08000000, 0x00010020, 0x00000420,
167     0x08000400, 0x00010420, 0x00000000, 0x08000020,
168     0x00000020, 0x08000420, 0x08010420, 0x00010020,
169     0x08010000, 0x00000400, 0x00000420, 0x08010400,
170     0x08010400, 0x08000420, 0x00010020, 0x08010000,
171     0x00010000, 0x00000020, 0x08000020, 0x08000400,
172     0x08000000, 0x00010400, 0x08010420, 0x00000000,
173     0x00010420, 0x08000000, 0x00000400, 0x00010020,
174     0x08000420, 0x00000400, 0x00000000, 0x08010420,
175     0x08010020, 0x08010400, 0x00000420, 0x00010000,
176     0x00010400, 0x08010020, 0x08000400, 0x00000420,
177     0x00000020, 0x00010420, 0x08010000, 0x08000020,
178   },
179   {
180     0x80000040, 0x00200040, 0x00000000, 0x80202000,
181     0x00200040, 0x00002000, 0x80002040, 0x00200000,
182     0x00002040, 0x80202040, 0x00202000, 0x80000000,
183     0x80002000, 0x80000040, 0x80200000, 0x00202040,
184     0x00200000, 0x80002040, 0x80200040, 0x00000000,
185     0x00002000, 0x00000040, 0x80202000, 0x80200040,
186     0x80202040, 0x80200000, 0x80000000, 0x00002040,
187     0x00000040, 0x00202000, 0x00202040, 0x80002000,
188     0x00002040, 0x80000000, 0x80002000, 0x00202040,
189     0x80202000, 0x00200040, 0x00000000, 0x80002000,
190     0x80000000, 0x00002000, 0x80200040, 0x00200000,
191     0x00200040, 0x80202040, 0x00202000, 0x00000040,
192     0x80202040, 0x00202000, 0x00200000, 0x80002040,
193     0x80000040, 0x80200000, 0x00202040, 0x00000000,
194     0x00002000, 0x80000040, 0x80002040, 0x80202000,
195     0x80200000, 0x00002040, 0x00000040, 0x80200040,
196   },
197   {
198     0x00004000, 0x00000200, 0x01000200, 0x01000004,
199     0x01004204, 0x00004004, 0x00004200, 0x00000000,
200     0x01000000, 0x01000204, 0x00000204, 0x01004000,
201     0x00000004, 0x01004200, 0x01004000, 0x00000204,
202     0x01000204, 0x00004000, 0x00004004, 0x01004204,
203     0x00000000, 0x01000200, 0x01000004, 0x00004200,
204     0x01004004, 0x00004204, 0x01004200, 0x00000004,
205     0x00004204, 0x01004004, 0x00000200, 0x01000000,
206     0x00004204, 0x01004000, 0x01004004, 0x00000204,
207     0x00004000, 0x00000200, 0x01000000, 0x01004004,
208     0x01000204, 0x00004204, 0x00004200, 0x00000000,
209     0x00000200, 0x01000004, 0x00000004, 0x01000200,
210     0x00000000, 0x01000204, 0x01000200, 0x00004200,
211     0x00000204, 0x00004000, 0x01004204, 0x01000000,
212     0x01004200, 0x00000004, 0x00004004, 0x01004204,
213     0x01000004, 0x01004200, 0x01004000, 0x00004004,
214   },
215   {
216     0x20800080, 0x20820000, 0x00020080, 0x00000000,
217     0x20020000, 0x00800080, 0x20800000, 0x20820080,
218     0x00000080, 0x20000000, 0x00820000, 0x00020080,
219     0x00820080, 0x20020080, 0x20000080, 0x20800000,
220     0x00020000, 0x00820080, 0x00800080, 0x20020000,
221     0x20820080, 0x20000080, 0x00000000, 0x00820000,
222     0x20000000, 0x00800000, 0x20020080, 0x20800080,
223     0x00800000, 0x00020000, 0x20820000, 0x00000080,
224     0x00800000, 0x00020000, 0x20000080, 0x20820080,
225     0x00020080, 0x20000000, 0x00000000, 0x00820000,
226     0x20800080, 0x20020080, 0x20020000, 0x00800080,
227     0x20820000, 0x00000080, 0x00800080, 0x20020000,
228     0x20820080, 0x00800000, 0x20800000, 0x20000080,
229     0x00820000, 0x00020080, 0x20020080, 0x20800000,
230     0x00000080, 0x20820000, 0x00820080, 0x00000000,
231     0x20000000, 0x20800080, 0x00020000, 0x00820080,
232   }
233 };
234
235 __constant u32 c_skb[8][64] =
236 {
237   {
238     0x00000000, 0x00000010, 0x20000000, 0x20000010,
239     0x00010000, 0x00010010, 0x20010000, 0x20010010,
240     0x00000800, 0x00000810, 0x20000800, 0x20000810,
241     0x00010800, 0x00010810, 0x20010800, 0x20010810,
242     0x00000020, 0x00000030, 0x20000020, 0x20000030,
243     0x00010020, 0x00010030, 0x20010020, 0x20010030,
244     0x00000820, 0x00000830, 0x20000820, 0x20000830,
245     0x00010820, 0x00010830, 0x20010820, 0x20010830,
246     0x00080000, 0x00080010, 0x20080000, 0x20080010,
247     0x00090000, 0x00090010, 0x20090000, 0x20090010,
248     0x00080800, 0x00080810, 0x20080800, 0x20080810,
249     0x00090800, 0x00090810, 0x20090800, 0x20090810,
250     0x00080020, 0x00080030, 0x20080020, 0x20080030,
251     0x00090020, 0x00090030, 0x20090020, 0x20090030,
252     0x00080820, 0x00080830, 0x20080820, 0x20080830,
253     0x00090820, 0x00090830, 0x20090820, 0x20090830,
254   },
255   {
256     0x00000000, 0x02000000, 0x00002000, 0x02002000,
257     0x00200000, 0x02200000, 0x00202000, 0x02202000,
258     0x00000004, 0x02000004, 0x00002004, 0x02002004,
259     0x00200004, 0x02200004, 0x00202004, 0x02202004,
260     0x00000400, 0x02000400, 0x00002400, 0x02002400,
261     0x00200400, 0x02200400, 0x00202400, 0x02202400,
262     0x00000404, 0x02000404, 0x00002404, 0x02002404,
263     0x00200404, 0x02200404, 0x00202404, 0x02202404,
264     0x10000000, 0x12000000, 0x10002000, 0x12002000,
265     0x10200000, 0x12200000, 0x10202000, 0x12202000,
266     0x10000004, 0x12000004, 0x10002004, 0x12002004,
267     0x10200004, 0x12200004, 0x10202004, 0x12202004,
268     0x10000400, 0x12000400, 0x10002400, 0x12002400,
269     0x10200400, 0x12200400, 0x10202400, 0x12202400,
270     0x10000404, 0x12000404, 0x10002404, 0x12002404,
271     0x10200404, 0x12200404, 0x10202404, 0x12202404,
272   },
273   {
274     0x00000000, 0x00000001, 0x00040000, 0x00040001,
275     0x01000000, 0x01000001, 0x01040000, 0x01040001,
276     0x00000002, 0x00000003, 0x00040002, 0x00040003,
277     0x01000002, 0x01000003, 0x01040002, 0x01040003,
278     0x00000200, 0x00000201, 0x00040200, 0x00040201,
279     0x01000200, 0x01000201, 0x01040200, 0x01040201,
280     0x00000202, 0x00000203, 0x00040202, 0x00040203,
281     0x01000202, 0x01000203, 0x01040202, 0x01040203,
282     0x08000000, 0x08000001, 0x08040000, 0x08040001,
283     0x09000000, 0x09000001, 0x09040000, 0x09040001,
284     0x08000002, 0x08000003, 0x08040002, 0x08040003,
285     0x09000002, 0x09000003, 0x09040002, 0x09040003,
286     0x08000200, 0x08000201, 0x08040200, 0x08040201,
287     0x09000200, 0x09000201, 0x09040200, 0x09040201,
288     0x08000202, 0x08000203, 0x08040202, 0x08040203,
289     0x09000202, 0x09000203, 0x09040202, 0x09040203,
290   },
291   {
292     0x00000000, 0x00100000, 0x00000100, 0x00100100,
293     0x00000008, 0x00100008, 0x00000108, 0x00100108,
294     0x00001000, 0x00101000, 0x00001100, 0x00101100,
295     0x00001008, 0x00101008, 0x00001108, 0x00101108,
296     0x04000000, 0x04100000, 0x04000100, 0x04100100,
297     0x04000008, 0x04100008, 0x04000108, 0x04100108,
298     0x04001000, 0x04101000, 0x04001100, 0x04101100,
299     0x04001008, 0x04101008, 0x04001108, 0x04101108,
300     0x00020000, 0x00120000, 0x00020100, 0x00120100,
301     0x00020008, 0x00120008, 0x00020108, 0x00120108,
302     0x00021000, 0x00121000, 0x00021100, 0x00121100,
303     0x00021008, 0x00121008, 0x00021108, 0x00121108,
304     0x04020000, 0x04120000, 0x04020100, 0x04120100,
305     0x04020008, 0x04120008, 0x04020108, 0x04120108,
306     0x04021000, 0x04121000, 0x04021100, 0x04121100,
307     0x04021008, 0x04121008, 0x04021108, 0x04121108,
308   },
309   {
310     0x00000000, 0x10000000, 0x00010000, 0x10010000,
311     0x00000004, 0x10000004, 0x00010004, 0x10010004,
312     0x20000000, 0x30000000, 0x20010000, 0x30010000,
313     0x20000004, 0x30000004, 0x20010004, 0x30010004,
314     0x00100000, 0x10100000, 0x00110000, 0x10110000,
315     0x00100004, 0x10100004, 0x00110004, 0x10110004,
316     0x20100000, 0x30100000, 0x20110000, 0x30110000,
317     0x20100004, 0x30100004, 0x20110004, 0x30110004,
318     0x00001000, 0x10001000, 0x00011000, 0x10011000,
319     0x00001004, 0x10001004, 0x00011004, 0x10011004,
320     0x20001000, 0x30001000, 0x20011000, 0x30011000,
321     0x20001004, 0x30001004, 0x20011004, 0x30011004,
322     0x00101000, 0x10101000, 0x00111000, 0x10111000,
323     0x00101004, 0x10101004, 0x00111004, 0x10111004,
324     0x20101000, 0x30101000, 0x20111000, 0x30111000,
325     0x20101004, 0x30101004, 0x20111004, 0x30111004,
326   },
327   {
328     0x00000000, 0x08000000, 0x00000008, 0x08000008,
329     0x00000400, 0x08000400, 0x00000408, 0x08000408,
330     0x00020000, 0x08020000, 0x00020008, 0x08020008,
331     0x00020400, 0x08020400, 0x00020408, 0x08020408,
332     0x00000001, 0x08000001, 0x00000009, 0x08000009,
333     0x00000401, 0x08000401, 0x00000409, 0x08000409,
334     0x00020001, 0x08020001, 0x00020009, 0x08020009,
335     0x00020401, 0x08020401, 0x00020409, 0x08020409,
336     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
337     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
338     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
339     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
340     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
341     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
342     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
343     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
344   },
345   {
346     0x00000000, 0x00000100, 0x00080000, 0x00080100,
347     0x01000000, 0x01000100, 0x01080000, 0x01080100,
348     0x00000010, 0x00000110, 0x00080010, 0x00080110,
349     0x01000010, 0x01000110, 0x01080010, 0x01080110,
350     0x00200000, 0x00200100, 0x00280000, 0x00280100,
351     0x01200000, 0x01200100, 0x01280000, 0x01280100,
352     0x00200010, 0x00200110, 0x00280010, 0x00280110,
353     0x01200010, 0x01200110, 0x01280010, 0x01280110,
354     0x00000200, 0x00000300, 0x00080200, 0x00080300,
355     0x01000200, 0x01000300, 0x01080200, 0x01080300,
356     0x00000210, 0x00000310, 0x00080210, 0x00080310,
357     0x01000210, 0x01000310, 0x01080210, 0x01080310,
358     0x00200200, 0x00200300, 0x00280200, 0x00280300,
359     0x01200200, 0x01200300, 0x01280200, 0x01280300,
360     0x00200210, 0x00200310, 0x00280210, 0x00280310,
361     0x01200210, 0x01200310, 0x01280210, 0x01280310,
362   },
363   {
364     0x00000000, 0x04000000, 0x00040000, 0x04040000,
365     0x00000002, 0x04000002, 0x00040002, 0x04040002,
366     0x00002000, 0x04002000, 0x00042000, 0x04042000,
367     0x00002002, 0x04002002, 0x00042002, 0x04042002,
368     0x00000020, 0x04000020, 0x00040020, 0x04040020,
369     0x00000022, 0x04000022, 0x00040022, 0x04040022,
370     0x00002020, 0x04002020, 0x00042020, 0x04042020,
371     0x00002022, 0x04002022, 0x00042022, 0x04042022,
372     0x00000800, 0x04000800, 0x00040800, 0x04040800,
373     0x00000802, 0x04000802, 0x00040802, 0x04040802,
374     0x00002800, 0x04002800, 0x00042800, 0x04042800,
375     0x00002802, 0x04002802, 0x00042802, 0x04042802,
376     0x00000820, 0x04000820, 0x00040820, 0x04040820,
377     0x00000822, 0x04000822, 0x00040822, 0x04040822,
378     0x00002820, 0x04002820, 0x00042820, 0x04042820,
379     0x00002822, 0x04002822, 0x00042822, 0x04042822
380   }
381 };
382
383 #if   VECT_SIZE == 1
384 #define BOX(i,n,S) (S)[(n)][(i)]
385 #elif VECT_SIZE == 2
386 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1])
387 #elif VECT_SIZE == 4
388 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3])
389 #elif VECT_SIZE == 8
390 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7])
391 #endif
392
393 #if   VECT_SIZE == 1
394 #define BOX1(i,S) (S)[(i)]
395 #elif VECT_SIZE == 2
396 #define BOX1(i,S) (u32x) ((S)[(i).s0], (S)[(i).s1])
397 #elif VECT_SIZE == 4
398 #define BOX1(i,S) (u32x) ((S)[(i).s0], (S)[(i).s1], (S)[(i).s2], (S)[(i).s3])
399 #elif VECT_SIZE == 8
400 #define BOX1(i,S) (u32x) ((S)[(i).s0], (S)[(i).s1], (S)[(i).s2], (S)[(i).s3], (S)[(i).s4], (S)[(i).s5], (S)[(i).s6], (S)[(i).s7])
401 #endif
402
403 static void _des_crypt_encrypt (u32 iv[2], u32 data[2], u32 Kc[16], u32 Kd[16], __local u32 (*s_SPtrans)[64])
404 {
405   u32 tt;
406
407   u32 r = data[0];
408   u32 l = data[1];
409
410   #pragma unroll 16
411   for (u32 i = 0; i < 16; i += 2)
412   {
413     u32 u;
414     u32 t;
415
416     u = Kc[i + 0] ^ r;
417     t = Kd[i + 0] ^ rotl32 (r, 28u);
418
419     l ^= BOX (((u >>  2) & 0x3f), 0, s_SPtrans)
420        | BOX (((u >> 10) & 0x3f), 2, s_SPtrans)
421        | BOX (((u >> 18) & 0x3f), 4, s_SPtrans)
422        | BOX (((u >> 26) & 0x3f), 6, s_SPtrans)
423        | BOX (((t >>  2) & 0x3f), 1, s_SPtrans)
424        | BOX (((t >> 10) & 0x3f), 3, s_SPtrans)
425        | BOX (((t >> 18) & 0x3f), 5, s_SPtrans)
426        | BOX (((t >> 26) & 0x3f), 7, s_SPtrans);
427
428     u = Kc[i + 1] ^ l;
429     t = Kd[i + 1] ^ rotl32 (l, 28u);
430
431     r ^= BOX (((u >>  2) & 0x3f), 0, s_SPtrans)
432        | BOX (((u >> 10) & 0x3f), 2, s_SPtrans)
433        | BOX (((u >> 18) & 0x3f), 4, s_SPtrans)
434        | BOX (((u >> 26) & 0x3f), 6, s_SPtrans)
435        | BOX (((t >>  2) & 0x3f), 1, s_SPtrans)
436        | BOX (((t >> 10) & 0x3f), 3, s_SPtrans)
437        | BOX (((t >> 18) & 0x3f), 5, s_SPtrans)
438        | BOX (((t >> 26) & 0x3f), 7, s_SPtrans);
439   }
440
441   iv[0] = l;
442   iv[1] = r;
443 }
444
445 static void _des_crypt_keysetup (u32 c, u32 d, u32 Kc[16], u32 Kd[16], __local u32 (*s_skb)[64])
446 {
447   u32 tt;
448
449   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
450   HPERM_OP (c,    tt, 2, 0xcccc0000);
451   HPERM_OP (d,    tt, 2, 0xcccc0000);
452   PERM_OP  (d, c, tt, 1, 0x55555555);
453   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
454   PERM_OP  (d, c, tt, 1, 0x55555555);
455
456   d = ((d & 0x000000ff) << 16)
457     | ((d & 0x0000ff00) <<  0)
458     | ((d & 0x00ff0000) >> 16)
459     | ((c & 0xf0000000) >>  4);
460
461   c = c & 0x0fffffff;
462
463   #pragma unroll 16
464   for (u32 i = 0; i < 16; i++)
465   {
466     if ((i < 2) || (i == 8) || (i == 15))
467     {
468       c = ((c >> 1) | (c << 27));
469       d = ((d >> 1) | (d << 27));
470     }
471     else
472     {
473       c = ((c >> 2) | (c << 26));
474       d = ((d >> 2) | (d << 26));
475     }
476
477     c = c & 0x0fffffff;
478     d = d & 0x0fffffff;
479
480     const u32 c00 = (c >>  0) & 0x0000003f;
481     const u32 c06 = (c >>  6) & 0x00383003;
482     const u32 c07 = (c >>  7) & 0x0000003c;
483     const u32 c13 = (c >> 13) & 0x0000060f;
484     const u32 c20 = (c >> 20) & 0x00000001;
485
486     u32 s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
487           | BOX (((c06 >>  0) & 0xff)
488                 |((c07 >>  0) & 0xff), 1, s_skb)
489           | BOX (((c13 >>  0) & 0xff)
490                 |((c06 >>  8) & 0xff), 2, s_skb)
491           | BOX (((c20 >>  0) & 0xff)
492                 |((c13 >>  8) & 0xff)
493                 |((c06 >> 16) & 0xff), 3, s_skb);
494
495     const u32 d00 = (d >>  0) & 0x00003c3f;
496     const u32 d07 = (d >>  7) & 0x00003f03;
497     const u32 d21 = (d >> 21) & 0x0000000f;
498     const u32 d22 = (d >> 22) & 0x00000030;
499
500     u32 t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
501           | BOX (((d07 >>  0) & 0xff)
502                 |((d00 >>  8) & 0xff), 5, s_skb)
503           | BOX (((d07 >>  8) & 0xff), 6, s_skb)
504           | BOX (((d21 >>  0) & 0xff)
505                 |((d22 >>  0) & 0xff), 7, s_skb);
506
507     Kc[i] = ((t << 16) | (s & 0x0000ffff));
508     Kd[i] = ((s >> 16) | (t & 0xffff0000));
509
510     Kc[i] = rotl32 (Kc[i], 2u);
511     Kd[i] = rotl32 (Kd[i], 2u);
512   }
513 }
514
515 static void transform_racf_key (const u32 w0, const u32 w1, u32 key[2])
516 {
517   key[0] = (ascii_to_ebcdic_pc[(w0 >>  0) & 0xff]) <<  0
518          | (ascii_to_ebcdic_pc[(w0 >>  8) & 0xff]) <<  8
519          | (ascii_to_ebcdic_pc[(w0 >> 16) & 0xff]) << 16
520          | (ascii_to_ebcdic_pc[(w0 >> 24) & 0xff]) << 24;
521
522   key[1] = (ascii_to_ebcdic_pc[(w1 >>  0) & 0xff]) <<  0
523          | (ascii_to_ebcdic_pc[(w1 >>  8) & 0xff]) <<  8
524          | (ascii_to_ebcdic_pc[(w1 >> 16) & 0xff]) << 16
525          | (ascii_to_ebcdic_pc[(w1 >> 24) & 0xff]) << 24;
526 }
527
528 __kernel void m08500_m04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
529 {
530   /**
531    * base
532    */
533
534   const u32 gid = get_global_id (0);
535   const u32 lid = get_local_id (0);
536   const u32 lsz = get_local_size (0);
537
538   /**
539    * shared
540    */
541
542   __local u32 s_SPtrans[8][64];
543   __local u32 s_skb[8][64];
544
545   for (u32 i = lid; i < 64; i += lsz)
546   {
547     s_SPtrans[0][i] = c_SPtrans[0][i];
548     s_SPtrans[1][i] = c_SPtrans[1][i];
549     s_SPtrans[2][i] = c_SPtrans[2][i];
550     s_SPtrans[3][i] = c_SPtrans[3][i];
551     s_SPtrans[4][i] = c_SPtrans[4][i];
552     s_SPtrans[5][i] = c_SPtrans[5][i];
553     s_SPtrans[6][i] = c_SPtrans[6][i];
554     s_SPtrans[7][i] = c_SPtrans[7][i];
555
556     s_skb[0][i] = c_skb[0][i];
557     s_skb[1][i] = c_skb[1][i];
558     s_skb[2][i] = c_skb[2][i];
559     s_skb[3][i] = c_skb[3][i];
560     s_skb[4][i] = c_skb[4][i];
561     s_skb[5][i] = c_skb[5][i];
562     s_skb[6][i] = c_skb[6][i];
563     s_skb[7][i] = c_skb[7][i];
564   }
565
566   barrier (CLK_LOCAL_MEM_FENCE);
567
568   if (gid >= gid_max) return;
569
570   /**
571    * base
572    */
573
574   u32 pw_buf[4];
575
576   pw_buf[0] = pws[gid].i[ 0];
577   pw_buf[1] = pws[gid].i[ 1];
578   pw_buf[2] = 0;
579   pw_buf[3] = 0;
580
581   const u32 pw_len = pws[gid].pw_len;
582
583   /**
584    * salt
585    */
586
587   u32 salt_buf0[2];
588
589   salt_buf0[0] = salt_bufs[salt_pos].salt_buf_pc[0];
590   salt_buf0[1] = salt_bufs[salt_pos].salt_buf_pc[1];
591
592   /**
593    * main
594    */
595
596   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
597   {
598     u32 w0[4];
599
600     w0[0] = pw_buf[0];
601     w0[1] = pw_buf[1];
602     w0[2] = pw_buf[2];
603     w0[3] = pw_buf[3];
604
605     u32 w1[4];
606
607     w1[0] = 0;
608     w1[1] = 0;
609     w1[2] = 0;
610     w1[3] = 0;
611
612     u32 w2[4];
613
614     w2[0] = 0;
615     w2[1] = 0;
616     w2[2] = 0;
617     w2[3] = 0;
618
619     u32 w3[4];
620
621     w3[0] = 0;
622     w3[1] = 0;
623     w3[2] = 0;
624     w3[3] = 0;
625
626     u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
627
628     out_len = (out_len >= 8) ? 8 : out_len;
629
630     u32 key[2];
631
632     transform_racf_key (w0[0], w0[1], key);
633
634     const u32 c = key[0];
635     const u32 d = key[1];
636
637     u32 Kc[16];
638     u32 Kd[16];
639
640     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
641
642     u32 data[2];
643
644     data[0] = salt_buf0[0];
645     data[1] = salt_buf0[1];
646
647     u32 iv[2];
648
649     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
650
651     const u32 r0 = iv[0];
652     const u32 r1 = iv[1];
653     const u32 r2 = 0;
654     const u32 r3 = 0;
655
656     #include COMPARE_M
657   }
658 }
659
660 __kernel void m08500_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
661 {
662 }
663
664 __kernel void m08500_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
665 {
666 }
667
668 __kernel void m08500_s04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
669 {
670   /**
671    * base
672    */
673
674   const u32 gid = get_global_id (0);
675   const u32 lid = get_local_id (0);
676   const u32 lsz = get_local_size (0);
677
678   /**
679    * shared
680    */
681
682   __local u32 s_SPtrans[8][64];
683   __local u32 s_skb[8][64];
684
685   for (u32 i = lid; i < 64; i += lsz)
686   {
687     s_SPtrans[0][i] = c_SPtrans[0][i];
688     s_SPtrans[1][i] = c_SPtrans[1][i];
689     s_SPtrans[2][i] = c_SPtrans[2][i];
690     s_SPtrans[3][i] = c_SPtrans[3][i];
691     s_SPtrans[4][i] = c_SPtrans[4][i];
692     s_SPtrans[5][i] = c_SPtrans[5][i];
693     s_SPtrans[6][i] = c_SPtrans[6][i];
694     s_SPtrans[7][i] = c_SPtrans[7][i];
695
696     s_skb[0][i] = c_skb[0][i];
697     s_skb[1][i] = c_skb[1][i];
698     s_skb[2][i] = c_skb[2][i];
699     s_skb[3][i] = c_skb[3][i];
700     s_skb[4][i] = c_skb[4][i];
701     s_skb[5][i] = c_skb[5][i];
702     s_skb[6][i] = c_skb[6][i];
703     s_skb[7][i] = c_skb[7][i];
704   }
705
706   barrier (CLK_LOCAL_MEM_FENCE);
707
708   if (gid >= gid_max) return;
709
710   /**
711    * base
712    */
713
714   u32 pw_buf[4];
715
716   pw_buf[0] = pws[gid].i[ 0];
717   pw_buf[1] = pws[gid].i[ 1];
718   pw_buf[2] = 0;
719   pw_buf[3] = 0;
720
721   const u32 pw_len = pws[gid].pw_len;
722
723   /**
724    * salt
725    */
726
727   u32 salt_buf0[2];
728
729   salt_buf0[0] = salt_bufs[salt_pos].salt_buf_pc[0];
730   salt_buf0[1] = salt_bufs[salt_pos].salt_buf_pc[1];
731
732   /**
733    * digest
734    */
735
736   const u32 search[4] =
737   {
738     digests_buf[digests_offset].digest_buf[DGST_R0],
739     digests_buf[digests_offset].digest_buf[DGST_R1],
740     digests_buf[digests_offset].digest_buf[DGST_R2],
741     digests_buf[digests_offset].digest_buf[DGST_R3]
742   };
743
744   /**
745    * main
746    */
747
748   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos++)
749   {
750     u32 w0[4];
751
752     w0[0] = pw_buf[0];
753     w0[1] = pw_buf[1];
754     w0[2] = pw_buf[2];
755     w0[3] = pw_buf[3];
756
757     u32 w1[4];
758
759     w1[0] = 0;
760     w1[1] = 0;
761     w1[2] = 0;
762     w1[3] = 0;
763
764     u32 w2[4];
765
766     w2[0] = 0;
767     w2[1] = 0;
768     w2[2] = 0;
769     w2[3] = 0;
770
771     u32 w3[4];
772
773     w3[0] = 0;
774     w3[1] = 0;
775     w3[2] = 0;
776     w3[3] = 0;
777
778     u32 out_len = apply_rules (rules_buf[il_pos].cmds, w0, w1, pw_len);
779
780     out_len = (out_len >= 8) ? 8 : out_len;
781
782     u32 key[2];
783
784     transform_racf_key (w0[0], w0[1], key);
785
786     const u32 c = key[0];
787     const u32 d = key[1];
788
789     u32 Kc[16];
790     u32 Kd[16];
791
792     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
793
794     u32 data[2];
795
796     data[0] = salt_buf0[0];
797     data[1] = salt_buf0[1];
798
799     u32 iv[2];
800
801     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
802
803     const u32 r0 = iv[0];
804     const u32 r1 = iv[1];
805     const u32 r2 = 0;
806     const u32 r3 = 0;
807
808     #include COMPARE_S
809   }
810 }
811
812 __kernel void m08500_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
813 {
814 }
815
816 __kernel void m08500_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
817 {
818 }