Fix warp bug on -m 8500
[hashcat.git] / OpenCL / m08500_a0.cl
1 /**
2  * Authors.....: Jens Steube <jens.steube@gmail.com>
3  *               Gabriele Gristina <matrix@hashcat.net>
4  *
5  * License.....: MIT
6  */
7
8 #define _DES_
9
10 #define NEW_SIMD_CODE
11
12 #include "include/constants.h"
13 #include "include/kernel_vendor.h"
14
15 #define DGST_R0 0
16 #define DGST_R1 1
17 #define DGST_R2 2
18 #define DGST_R3 3
19
20 #include "include/kernel_functions.c"
21 #include "OpenCL/types_ocl.c"
22 #include "OpenCL/common.c"
23 #include "include/rp_kernel.h"
24 #include "OpenCL/rp.c"
25 #include "OpenCL/simd.c"
26
27 #define PERM_OP(a,b,tt,n,m) \
28 {                           \
29   tt = a >> n;              \
30   tt = tt ^ b;              \
31   tt = tt & m;              \
32   b = b ^ tt;               \
33   tt = tt << n;             \
34   a = a ^ tt;               \
35 }
36
37 #define HPERM_OP(a,tt,n,m)  \
38 {                           \
39   tt = a << (16 + n);       \
40   tt = tt ^ a;              \
41   tt = tt & m;              \
42   a  = a ^ tt;              \
43   tt = tt >> (16 + n);      \
44   a  = a ^ tt;              \
45 }
46
47 #define IP(l,r,tt)                     \
48 {                                      \
49   PERM_OP (r, l, tt,  4, 0x0f0f0f0f);  \
50   PERM_OP (l, r, tt, 16, 0x0000ffff);  \
51   PERM_OP (r, l, tt,  2, 0x33333333);  \
52   PERM_OP (l, r, tt,  8, 0x00ff00ff);  \
53   PERM_OP (r, l, tt,  1, 0x55555555);  \
54 }
55
56 #define FP(l,r,tt)                     \
57 {                                      \
58   PERM_OP (l, r, tt,  1, 0x55555555);  \
59   PERM_OP (r, l, tt,  8, 0x00ff00ff);  \
60   PERM_OP (l, r, tt,  2, 0x33333333);  \
61   PERM_OP (r, l, tt, 16, 0x0000ffff);  \
62   PERM_OP (l, r, tt,  4, 0x0f0f0f0f);  \
63 }
64
65 __constant u8 ascii_to_ebcdic_pc[256] =
66 {
67   // little hack, can't crack 0-bytes in password, but who cares
68   //    0xab, 0xa8, 0xae, 0xad, 0xc4, 0xf1, 0xf7, 0xf4, 0x86, 0xa1, 0xe0, 0xbc, 0xb3, 0xb0, 0xb6, 0xb5,
69   0x2a, 0xa8, 0xae, 0xad, 0xc4, 0xf1, 0xf7, 0xf4, 0x86, 0xa1, 0xe0, 0xbc, 0xb3, 0xb0, 0xb6, 0xb5,
70   0x8a, 0x89, 0x8f, 0x8c, 0xd3, 0xd0, 0xce, 0xe6, 0x9b, 0x98, 0xd5, 0xe5, 0x92, 0x91, 0x97, 0x94,
71   0x2a, 0x34, 0x54, 0x5d, 0x1c, 0x73, 0x0b, 0x51, 0x31, 0x10, 0x13, 0x37, 0x7c, 0x6b, 0x3d, 0x68,
72   0x4a, 0x49, 0x4f, 0x4c, 0x43, 0x40, 0x46, 0x45, 0x5b, 0x58, 0x5e, 0x16, 0x32, 0x57, 0x76, 0x75,
73   0x52, 0x29, 0x2f, 0x2c, 0x23, 0x20, 0x26, 0x25, 0x3b, 0x38, 0x08, 0x0e, 0x0d, 0x02, 0x01, 0x07,
74   0x04, 0x1a, 0x19, 0x6e, 0x6d, 0x62, 0x61, 0x67, 0x64, 0x7a, 0x79, 0x3e, 0x6b, 0x1f, 0x15, 0x70,
75   0x58, 0xa8, 0xae, 0xad, 0xa2, 0xa1, 0xa7, 0xa4, 0xba, 0xb9, 0x89, 0x8f, 0x8c, 0x83, 0x80, 0x86,
76   0x85, 0x9b, 0x98, 0xef, 0xec, 0xe3, 0xe0, 0xe6, 0xe5, 0xfb, 0xf8, 0x2a, 0x7f, 0x0b, 0xe9, 0xa4,
77   0xea, 0xe9, 0xef, 0xec, 0xe3, 0x80, 0xa7, 0x85, 0xfb, 0xf8, 0xfe, 0xfd, 0xf2, 0xb9, 0xbf, 0x9d,
78   0xcb, 0xc8, 0x9e, 0xcd, 0xc2, 0xc1, 0xc7, 0xba, 0xda, 0xd9, 0xdf, 0xdc, 0xa2, 0x83, 0xd6, 0x68,
79   0x29, 0x2f, 0x2c, 0x23, 0x20, 0x26, 0x25, 0x3b, 0x38, 0x08, 0x0e, 0x0d, 0x02, 0x01, 0x07, 0x04,
80   0x1a, 0x19, 0x6e, 0x6d, 0x62, 0x61, 0x67, 0x64, 0x7a, 0x79, 0x4a, 0x49, 0x4f, 0x4c, 0x43, 0x40,
81   0x46, 0x45, 0x5b, 0xab, 0xbf, 0xbc, 0xb3, 0xb0, 0xb6, 0xb5, 0x8a, 0x9e, 0x9d, 0x92, 0x91, 0x97,
82   0x94, 0xea, 0xfe, 0xfd, 0xf2, 0xf1, 0xf7, 0xf4, 0xcb, 0xc8, 0xce, 0xcd, 0xc2, 0xc1, 0xc7, 0xc4,
83   0xda, 0xd9, 0xdf, 0xdc, 0xd3, 0xd0, 0xd6, 0xd5, 0x3e, 0x3d, 0x32, 0x31, 0x37, 0x34, 0x1f, 0x1c,
84   0x13, 0x10, 0x16, 0x15, 0x7f, 0x7c, 0x73, 0x70, 0x76, 0x75, 0x5e, 0x5d, 0x52, 0x51, 0x57, 0x54,
85 };
86
87 __constant u32 c_SPtrans[8][64] =
88 {
89   {
90     0x02080800, 0x00080000, 0x02000002, 0x02080802,
91     0x02000000, 0x00080802, 0x00080002, 0x02000002,
92     0x00080802, 0x02080800, 0x02080000, 0x00000802,
93     0x02000802, 0x02000000, 0x00000000, 0x00080002,
94     0x00080000, 0x00000002, 0x02000800, 0x00080800,
95     0x02080802, 0x02080000, 0x00000802, 0x02000800,
96     0x00000002, 0x00000800, 0x00080800, 0x02080002,
97     0x00000800, 0x02000802, 0x02080002, 0x00000000,
98     0x00000000, 0x02080802, 0x02000800, 0x00080002,
99     0x02080800, 0x00080000, 0x00000802, 0x02000800,
100     0x02080002, 0x00000800, 0x00080800, 0x02000002,
101     0x00080802, 0x00000002, 0x02000002, 0x02080000,
102     0x02080802, 0x00080800, 0x02080000, 0x02000802,
103     0x02000000, 0x00000802, 0x00080002, 0x00000000,
104     0x00080000, 0x02000000, 0x02000802, 0x02080800,
105     0x00000002, 0x02080002, 0x00000800, 0x00080802,
106   },
107   {
108     0x40108010, 0x00000000, 0x00108000, 0x40100000,
109     0x40000010, 0x00008010, 0x40008000, 0x00108000,
110     0x00008000, 0x40100010, 0x00000010, 0x40008000,
111     0x00100010, 0x40108000, 0x40100000, 0x00000010,
112     0x00100000, 0x40008010, 0x40100010, 0x00008000,
113     0x00108010, 0x40000000, 0x00000000, 0x00100010,
114     0x40008010, 0x00108010, 0x40108000, 0x40000010,
115     0x40000000, 0x00100000, 0x00008010, 0x40108010,
116     0x00100010, 0x40108000, 0x40008000, 0x00108010,
117     0x40108010, 0x00100010, 0x40000010, 0x00000000,
118     0x40000000, 0x00008010, 0x00100000, 0x40100010,
119     0x00008000, 0x40000000, 0x00108010, 0x40008010,
120     0x40108000, 0x00008000, 0x00000000, 0x40000010,
121     0x00000010, 0x40108010, 0x00108000, 0x40100000,
122     0x40100010, 0x00100000, 0x00008010, 0x40008000,
123     0x40008010, 0x00000010, 0x40100000, 0x00108000,
124   },
125   {
126     0x04000001, 0x04040100, 0x00000100, 0x04000101,
127     0x00040001, 0x04000000, 0x04000101, 0x00040100,
128     0x04000100, 0x00040000, 0x04040000, 0x00000001,
129     0x04040101, 0x00000101, 0x00000001, 0x04040001,
130     0x00000000, 0x00040001, 0x04040100, 0x00000100,
131     0x00000101, 0x04040101, 0x00040000, 0x04000001,
132     0x04040001, 0x04000100, 0x00040101, 0x04040000,
133     0x00040100, 0x00000000, 0x04000000, 0x00040101,
134     0x04040100, 0x00000100, 0x00000001, 0x00040000,
135     0x00000101, 0x00040001, 0x04040000, 0x04000101,
136     0x00000000, 0x04040100, 0x00040100, 0x04040001,
137     0x00040001, 0x04000000, 0x04040101, 0x00000001,
138     0x00040101, 0x04000001, 0x04000000, 0x04040101,
139     0x00040000, 0x04000100, 0x04000101, 0x00040100,
140     0x04000100, 0x00000000, 0x04040001, 0x00000101,
141     0x04000001, 0x00040101, 0x00000100, 0x04040000,
142   },
143   {
144     0x00401008, 0x10001000, 0x00000008, 0x10401008,
145     0x00000000, 0x10400000, 0x10001008, 0x00400008,
146     0x10401000, 0x10000008, 0x10000000, 0x00001008,
147     0x10000008, 0x00401008, 0x00400000, 0x10000000,
148     0x10400008, 0x00401000, 0x00001000, 0x00000008,
149     0x00401000, 0x10001008, 0x10400000, 0x00001000,
150     0x00001008, 0x00000000, 0x00400008, 0x10401000,
151     0x10001000, 0x10400008, 0x10401008, 0x00400000,
152     0x10400008, 0x00001008, 0x00400000, 0x10000008,
153     0x00401000, 0x10001000, 0x00000008, 0x10400000,
154     0x10001008, 0x00000000, 0x00001000, 0x00400008,
155     0x00000000, 0x10400008, 0x10401000, 0x00001000,
156     0x10000000, 0x10401008, 0x00401008, 0x00400000,
157     0x10401008, 0x00000008, 0x10001000, 0x00401008,
158     0x00400008, 0x00401000, 0x10400000, 0x10001008,
159     0x00001008, 0x10000000, 0x10000008, 0x10401000,
160   },
161   {
162     0x08000000, 0x00010000, 0x00000400, 0x08010420,
163     0x08010020, 0x08000400, 0x00010420, 0x08010000,
164     0x00010000, 0x00000020, 0x08000020, 0x00010400,
165     0x08000420, 0x08010020, 0x08010400, 0x00000000,
166     0x00010400, 0x08000000, 0x00010020, 0x00000420,
167     0x08000400, 0x00010420, 0x00000000, 0x08000020,
168     0x00000020, 0x08000420, 0x08010420, 0x00010020,
169     0x08010000, 0x00000400, 0x00000420, 0x08010400,
170     0x08010400, 0x08000420, 0x00010020, 0x08010000,
171     0x00010000, 0x00000020, 0x08000020, 0x08000400,
172     0x08000000, 0x00010400, 0x08010420, 0x00000000,
173     0x00010420, 0x08000000, 0x00000400, 0x00010020,
174     0x08000420, 0x00000400, 0x00000000, 0x08010420,
175     0x08010020, 0x08010400, 0x00000420, 0x00010000,
176     0x00010400, 0x08010020, 0x08000400, 0x00000420,
177     0x00000020, 0x00010420, 0x08010000, 0x08000020,
178   },
179   {
180     0x80000040, 0x00200040, 0x00000000, 0x80202000,
181     0x00200040, 0x00002000, 0x80002040, 0x00200000,
182     0x00002040, 0x80202040, 0x00202000, 0x80000000,
183     0x80002000, 0x80000040, 0x80200000, 0x00202040,
184     0x00200000, 0x80002040, 0x80200040, 0x00000000,
185     0x00002000, 0x00000040, 0x80202000, 0x80200040,
186     0x80202040, 0x80200000, 0x80000000, 0x00002040,
187     0x00000040, 0x00202000, 0x00202040, 0x80002000,
188     0x00002040, 0x80000000, 0x80002000, 0x00202040,
189     0x80202000, 0x00200040, 0x00000000, 0x80002000,
190     0x80000000, 0x00002000, 0x80200040, 0x00200000,
191     0x00200040, 0x80202040, 0x00202000, 0x00000040,
192     0x80202040, 0x00202000, 0x00200000, 0x80002040,
193     0x80000040, 0x80200000, 0x00202040, 0x00000000,
194     0x00002000, 0x80000040, 0x80002040, 0x80202000,
195     0x80200000, 0x00002040, 0x00000040, 0x80200040,
196   },
197   {
198     0x00004000, 0x00000200, 0x01000200, 0x01000004,
199     0x01004204, 0x00004004, 0x00004200, 0x00000000,
200     0x01000000, 0x01000204, 0x00000204, 0x01004000,
201     0x00000004, 0x01004200, 0x01004000, 0x00000204,
202     0x01000204, 0x00004000, 0x00004004, 0x01004204,
203     0x00000000, 0x01000200, 0x01000004, 0x00004200,
204     0x01004004, 0x00004204, 0x01004200, 0x00000004,
205     0x00004204, 0x01004004, 0x00000200, 0x01000000,
206     0x00004204, 0x01004000, 0x01004004, 0x00000204,
207     0x00004000, 0x00000200, 0x01000000, 0x01004004,
208     0x01000204, 0x00004204, 0x00004200, 0x00000000,
209     0x00000200, 0x01000004, 0x00000004, 0x01000200,
210     0x00000000, 0x01000204, 0x01000200, 0x00004200,
211     0x00000204, 0x00004000, 0x01004204, 0x01000000,
212     0x01004200, 0x00000004, 0x00004004, 0x01004204,
213     0x01000004, 0x01004200, 0x01004000, 0x00004004,
214   },
215   {
216     0x20800080, 0x20820000, 0x00020080, 0x00000000,
217     0x20020000, 0x00800080, 0x20800000, 0x20820080,
218     0x00000080, 0x20000000, 0x00820000, 0x00020080,
219     0x00820080, 0x20020080, 0x20000080, 0x20800000,
220     0x00020000, 0x00820080, 0x00800080, 0x20020000,
221     0x20820080, 0x20000080, 0x00000000, 0x00820000,
222     0x20000000, 0x00800000, 0x20020080, 0x20800080,
223     0x00800000, 0x00020000, 0x20820000, 0x00000080,
224     0x00800000, 0x00020000, 0x20000080, 0x20820080,
225     0x00020080, 0x20000000, 0x00000000, 0x00820000,
226     0x20800080, 0x20020080, 0x20020000, 0x00800080,
227     0x20820000, 0x00000080, 0x00800080, 0x20020000,
228     0x20820080, 0x00800000, 0x20800000, 0x20000080,
229     0x00820000, 0x00020080, 0x20020080, 0x20800000,
230     0x00000080, 0x20820000, 0x00820080, 0x00000000,
231     0x20000000, 0x20800080, 0x00020000, 0x00820080,
232   }
233 };
234
235 __constant u32 c_skb[8][64] =
236 {
237   {
238     0x00000000, 0x00000010, 0x20000000, 0x20000010,
239     0x00010000, 0x00010010, 0x20010000, 0x20010010,
240     0x00000800, 0x00000810, 0x20000800, 0x20000810,
241     0x00010800, 0x00010810, 0x20010800, 0x20010810,
242     0x00000020, 0x00000030, 0x20000020, 0x20000030,
243     0x00010020, 0x00010030, 0x20010020, 0x20010030,
244     0x00000820, 0x00000830, 0x20000820, 0x20000830,
245     0x00010820, 0x00010830, 0x20010820, 0x20010830,
246     0x00080000, 0x00080010, 0x20080000, 0x20080010,
247     0x00090000, 0x00090010, 0x20090000, 0x20090010,
248     0x00080800, 0x00080810, 0x20080800, 0x20080810,
249     0x00090800, 0x00090810, 0x20090800, 0x20090810,
250     0x00080020, 0x00080030, 0x20080020, 0x20080030,
251     0x00090020, 0x00090030, 0x20090020, 0x20090030,
252     0x00080820, 0x00080830, 0x20080820, 0x20080830,
253     0x00090820, 0x00090830, 0x20090820, 0x20090830,
254   },
255   {
256     0x00000000, 0x02000000, 0x00002000, 0x02002000,
257     0x00200000, 0x02200000, 0x00202000, 0x02202000,
258     0x00000004, 0x02000004, 0x00002004, 0x02002004,
259     0x00200004, 0x02200004, 0x00202004, 0x02202004,
260     0x00000400, 0x02000400, 0x00002400, 0x02002400,
261     0x00200400, 0x02200400, 0x00202400, 0x02202400,
262     0x00000404, 0x02000404, 0x00002404, 0x02002404,
263     0x00200404, 0x02200404, 0x00202404, 0x02202404,
264     0x10000000, 0x12000000, 0x10002000, 0x12002000,
265     0x10200000, 0x12200000, 0x10202000, 0x12202000,
266     0x10000004, 0x12000004, 0x10002004, 0x12002004,
267     0x10200004, 0x12200004, 0x10202004, 0x12202004,
268     0x10000400, 0x12000400, 0x10002400, 0x12002400,
269     0x10200400, 0x12200400, 0x10202400, 0x12202400,
270     0x10000404, 0x12000404, 0x10002404, 0x12002404,
271     0x10200404, 0x12200404, 0x10202404, 0x12202404,
272   },
273   {
274     0x00000000, 0x00000001, 0x00040000, 0x00040001,
275     0x01000000, 0x01000001, 0x01040000, 0x01040001,
276     0x00000002, 0x00000003, 0x00040002, 0x00040003,
277     0x01000002, 0x01000003, 0x01040002, 0x01040003,
278     0x00000200, 0x00000201, 0x00040200, 0x00040201,
279     0x01000200, 0x01000201, 0x01040200, 0x01040201,
280     0x00000202, 0x00000203, 0x00040202, 0x00040203,
281     0x01000202, 0x01000203, 0x01040202, 0x01040203,
282     0x08000000, 0x08000001, 0x08040000, 0x08040001,
283     0x09000000, 0x09000001, 0x09040000, 0x09040001,
284     0x08000002, 0x08000003, 0x08040002, 0x08040003,
285     0x09000002, 0x09000003, 0x09040002, 0x09040003,
286     0x08000200, 0x08000201, 0x08040200, 0x08040201,
287     0x09000200, 0x09000201, 0x09040200, 0x09040201,
288     0x08000202, 0x08000203, 0x08040202, 0x08040203,
289     0x09000202, 0x09000203, 0x09040202, 0x09040203,
290   },
291   {
292     0x00000000, 0x00100000, 0x00000100, 0x00100100,
293     0x00000008, 0x00100008, 0x00000108, 0x00100108,
294     0x00001000, 0x00101000, 0x00001100, 0x00101100,
295     0x00001008, 0x00101008, 0x00001108, 0x00101108,
296     0x04000000, 0x04100000, 0x04000100, 0x04100100,
297     0x04000008, 0x04100008, 0x04000108, 0x04100108,
298     0x04001000, 0x04101000, 0x04001100, 0x04101100,
299     0x04001008, 0x04101008, 0x04001108, 0x04101108,
300     0x00020000, 0x00120000, 0x00020100, 0x00120100,
301     0x00020008, 0x00120008, 0x00020108, 0x00120108,
302     0x00021000, 0x00121000, 0x00021100, 0x00121100,
303     0x00021008, 0x00121008, 0x00021108, 0x00121108,
304     0x04020000, 0x04120000, 0x04020100, 0x04120100,
305     0x04020008, 0x04120008, 0x04020108, 0x04120108,
306     0x04021000, 0x04121000, 0x04021100, 0x04121100,
307     0x04021008, 0x04121008, 0x04021108, 0x04121108,
308   },
309   {
310     0x00000000, 0x10000000, 0x00010000, 0x10010000,
311     0x00000004, 0x10000004, 0x00010004, 0x10010004,
312     0x20000000, 0x30000000, 0x20010000, 0x30010000,
313     0x20000004, 0x30000004, 0x20010004, 0x30010004,
314     0x00100000, 0x10100000, 0x00110000, 0x10110000,
315     0x00100004, 0x10100004, 0x00110004, 0x10110004,
316     0x20100000, 0x30100000, 0x20110000, 0x30110000,
317     0x20100004, 0x30100004, 0x20110004, 0x30110004,
318     0x00001000, 0x10001000, 0x00011000, 0x10011000,
319     0x00001004, 0x10001004, 0x00011004, 0x10011004,
320     0x20001000, 0x30001000, 0x20011000, 0x30011000,
321     0x20001004, 0x30001004, 0x20011004, 0x30011004,
322     0x00101000, 0x10101000, 0x00111000, 0x10111000,
323     0x00101004, 0x10101004, 0x00111004, 0x10111004,
324     0x20101000, 0x30101000, 0x20111000, 0x30111000,
325     0x20101004, 0x30101004, 0x20111004, 0x30111004,
326   },
327   {
328     0x00000000, 0x08000000, 0x00000008, 0x08000008,
329     0x00000400, 0x08000400, 0x00000408, 0x08000408,
330     0x00020000, 0x08020000, 0x00020008, 0x08020008,
331     0x00020400, 0x08020400, 0x00020408, 0x08020408,
332     0x00000001, 0x08000001, 0x00000009, 0x08000009,
333     0x00000401, 0x08000401, 0x00000409, 0x08000409,
334     0x00020001, 0x08020001, 0x00020009, 0x08020009,
335     0x00020401, 0x08020401, 0x00020409, 0x08020409,
336     0x02000000, 0x0A000000, 0x02000008, 0x0A000008,
337     0x02000400, 0x0A000400, 0x02000408, 0x0A000408,
338     0x02020000, 0x0A020000, 0x02020008, 0x0A020008,
339     0x02020400, 0x0A020400, 0x02020408, 0x0A020408,
340     0x02000001, 0x0A000001, 0x02000009, 0x0A000009,
341     0x02000401, 0x0A000401, 0x02000409, 0x0A000409,
342     0x02020001, 0x0A020001, 0x02020009, 0x0A020009,
343     0x02020401, 0x0A020401, 0x02020409, 0x0A020409,
344   },
345   {
346     0x00000000, 0x00000100, 0x00080000, 0x00080100,
347     0x01000000, 0x01000100, 0x01080000, 0x01080100,
348     0x00000010, 0x00000110, 0x00080010, 0x00080110,
349     0x01000010, 0x01000110, 0x01080010, 0x01080110,
350     0x00200000, 0x00200100, 0x00280000, 0x00280100,
351     0x01200000, 0x01200100, 0x01280000, 0x01280100,
352     0x00200010, 0x00200110, 0x00280010, 0x00280110,
353     0x01200010, 0x01200110, 0x01280010, 0x01280110,
354     0x00000200, 0x00000300, 0x00080200, 0x00080300,
355     0x01000200, 0x01000300, 0x01080200, 0x01080300,
356     0x00000210, 0x00000310, 0x00080210, 0x00080310,
357     0x01000210, 0x01000310, 0x01080210, 0x01080310,
358     0x00200200, 0x00200300, 0x00280200, 0x00280300,
359     0x01200200, 0x01200300, 0x01280200, 0x01280300,
360     0x00200210, 0x00200310, 0x00280210, 0x00280310,
361     0x01200210, 0x01200310, 0x01280210, 0x01280310,
362   },
363   {
364     0x00000000, 0x04000000, 0x00040000, 0x04040000,
365     0x00000002, 0x04000002, 0x00040002, 0x04040002,
366     0x00002000, 0x04002000, 0x00042000, 0x04042000,
367     0x00002002, 0x04002002, 0x00042002, 0x04042002,
368     0x00000020, 0x04000020, 0x00040020, 0x04040020,
369     0x00000022, 0x04000022, 0x00040022, 0x04040022,
370     0x00002020, 0x04002020, 0x00042020, 0x04042020,
371     0x00002022, 0x04002022, 0x00042022, 0x04042022,
372     0x00000800, 0x04000800, 0x00040800, 0x04040800,
373     0x00000802, 0x04000802, 0x00040802, 0x04040802,
374     0x00002800, 0x04002800, 0x00042800, 0x04042800,
375     0x00002802, 0x04002802, 0x00042802, 0x04042802,
376     0x00000820, 0x04000820, 0x00040820, 0x04040820,
377     0x00000822, 0x04000822, 0x00040822, 0x04040822,
378     0x00002820, 0x04002820, 0x00042820, 0x04042820,
379     0x00002822, 0x04002822, 0x00042822, 0x04042822
380   }
381 };
382
383 #if   VECT_SIZE == 1
384 #define BOX(i,n,S) (S)[(n)][(i)]
385 #elif VECT_SIZE == 2
386 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1])
387 #elif VECT_SIZE == 4
388 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3])
389 #elif VECT_SIZE == 8
390 #define BOX(i,n,S) (u32x) ((S)[(n)][(i).s0], (S)[(n)][(i).s1], (S)[(n)][(i).s2], (S)[(n)][(i).s3], (S)[(n)][(i).s4], (S)[(n)][(i).s5], (S)[(n)][(i).s6], (S)[(n)][(i).s7])
391 #endif
392
393 #if   VECT_SIZE == 1
394 #define BOX1(i,S) (S)[(i)]
395 #elif VECT_SIZE == 2
396 #define BOX1(i,S) (u32x) ((S)[(i).s0], (S)[(i).s1])
397 #elif VECT_SIZE == 4
398 #define BOX1(i,S) (u32x) ((S)[(i).s0], (S)[(i).s1], (S)[(i).s2], (S)[(i).s3])
399 #elif VECT_SIZE == 8
400 #define BOX1(i,S) (u32x) ((S)[(i).s0], (S)[(i).s1], (S)[(i).s2], (S)[(i).s3], (S)[(i).s4], (S)[(i).s5], (S)[(i).s6], (S)[(i).s7])
401 #endif
402
403 static void _des_crypt_encrypt (u32x iv[2], u32x data[2], u32x Kc[16], u32x Kd[16], __local u32 (*s_SPtrans)[64])
404 {
405   u32x r = data[0];
406   u32x l = data[1];
407
408   #pragma unroll 16
409   for (u32 i = 0; i < 16; i += 2)
410   {
411     u32x u;
412     u32x t;
413
414     u = Kc[i + 0] ^ r;
415     t = Kd[i + 0] ^ rotl32 (r, 28u);
416
417     l ^= BOX (((u >>  2) & 0x3f), 0, s_SPtrans)
418        | BOX (((u >> 10) & 0x3f), 2, s_SPtrans)
419        | BOX (((u >> 18) & 0x3f), 4, s_SPtrans)
420        | BOX (((u >> 26) & 0x3f), 6, s_SPtrans)
421        | BOX (((t >>  2) & 0x3f), 1, s_SPtrans)
422        | BOX (((t >> 10) & 0x3f), 3, s_SPtrans)
423        | BOX (((t >> 18) & 0x3f), 5, s_SPtrans)
424        | BOX (((t >> 26) & 0x3f), 7, s_SPtrans);
425
426     u = Kc[i + 1] ^ l;
427     t = Kd[i + 1] ^ rotl32 (l, 28u);
428
429     r ^= BOX (((u >>  2) & 0x3f), 0, s_SPtrans)
430        | BOX (((u >> 10) & 0x3f), 2, s_SPtrans)
431        | BOX (((u >> 18) & 0x3f), 4, s_SPtrans)
432        | BOX (((u >> 26) & 0x3f), 6, s_SPtrans)
433        | BOX (((t >>  2) & 0x3f), 1, s_SPtrans)
434        | BOX (((t >> 10) & 0x3f), 3, s_SPtrans)
435        | BOX (((t >> 18) & 0x3f), 5, s_SPtrans)
436        | BOX (((t >> 26) & 0x3f), 7, s_SPtrans);
437   }
438
439   iv[0] = l;
440   iv[1] = r;
441 }
442
443 static void _des_crypt_keysetup (u32x c, u32x d, u32x Kc[16], u32x Kd[16], __local u32 (*s_skb)[64])
444 {
445   u32x tt;
446
447   PERM_OP  (d, c, tt, 4, 0x0f0f0f0f);
448   HPERM_OP (c,    tt, 2, 0xcccc0000);
449   HPERM_OP (d,    tt, 2, 0xcccc0000);
450   PERM_OP  (d, c, tt, 1, 0x55555555);
451   PERM_OP  (c, d, tt, 8, 0x00ff00ff);
452   PERM_OP  (d, c, tt, 1, 0x55555555);
453
454   d = ((d & 0x000000ff) << 16)
455     | ((d & 0x0000ff00) <<  0)
456     | ((d & 0x00ff0000) >> 16)
457     | ((c & 0xf0000000) >>  4);
458
459   c = c & 0x0fffffff;
460
461   #pragma unroll 16
462   for (u32 i = 0; i < 16; i++)
463   {
464     if ((i < 2) || (i == 8) || (i == 15))
465     {
466       c = ((c >> 1) | (c << 27));
467       d = ((d >> 1) | (d << 27));
468     }
469     else
470     {
471       c = ((c >> 2) | (c << 26));
472       d = ((d >> 2) | (d << 26));
473     }
474
475     c = c & 0x0fffffff;
476     d = d & 0x0fffffff;
477
478     const u32x c00 = (c >>  0) & 0x0000003f;
479     const u32x c06 = (c >>  6) & 0x00383003;
480     const u32x c07 = (c >>  7) & 0x0000003c;
481     const u32x c13 = (c >> 13) & 0x0000060f;
482     const u32x c20 = (c >> 20) & 0x00000001;
483
484     u32x s = BOX (((c00 >>  0) & 0xff), 0, s_skb)
485            | BOX (((c06 >>  0) & 0xff)
486                  |((c07 >>  0) & 0xff), 1, s_skb)
487            | BOX (((c13 >>  0) & 0xff)
488                  |((c06 >>  8) & 0xff), 2, s_skb)
489            | BOX (((c20 >>  0) & 0xff)
490                  |((c13 >>  8) & 0xff)
491                  |((c06 >> 16) & 0xff), 3, s_skb);
492
493     const u32x d00 = (d >>  0) & 0x00003c3f;
494     const u32x d07 = (d >>  7) & 0x00003f03;
495     const u32x d21 = (d >> 21) & 0x0000000f;
496     const u32x d22 = (d >> 22) & 0x00000030;
497
498     u32x t = BOX (((d00 >>  0) & 0xff), 4, s_skb)
499            | BOX (((d07 >>  0) & 0xff)
500                  |((d00 >>  8) & 0xff), 5, s_skb)
501            | BOX (((d07 >>  8) & 0xff), 6, s_skb)
502            | BOX (((d21 >>  0) & 0xff)
503                  |((d22 >>  0) & 0xff), 7, s_skb);
504
505     Kc[i] = ((t << 16) | (s & 0x0000ffff));
506     Kd[i] = ((s >> 16) | (t & 0xffff0000));
507
508     Kc[i] = rotl32 (Kc[i], 2u);
509     Kd[i] = rotl32 (Kd[i], 2u);
510   }
511 }
512
513 static void transform_racf_key (const u32x w0, const u32x w1, u32x key[2])
514 {
515   key[0] = BOX1 (((w0 >>  0) & 0xff), ascii_to_ebcdic_pc) <<  0
516          | BOX1 (((w0 >>  8) & 0xff), ascii_to_ebcdic_pc) <<  8
517          | BOX1 (((w0 >> 16) & 0xff), ascii_to_ebcdic_pc) << 16
518          | BOX1 (((w0 >> 24) & 0xff), ascii_to_ebcdic_pc) << 24;
519
520   key[1] = BOX1 (((w1 >>  0) & 0xff), ascii_to_ebcdic_pc) <<  0
521          | BOX1 (((w1 >>  8) & 0xff), ascii_to_ebcdic_pc) <<  8
522          | BOX1 (((w1 >> 16) & 0xff), ascii_to_ebcdic_pc) << 16
523          | BOX1 (((w1 >> 24) & 0xff), ascii_to_ebcdic_pc) << 24;
524 }
525
526 __kernel void m08500_m04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
527 {
528   /**
529    * base
530    */
531
532   const u32 gid = get_global_id (0);
533   const u32 lid = get_local_id (0);
534   const u32 lsz = get_local_size (0);
535
536   /**
537    * shared
538    */
539
540   __local u32 s_SPtrans[8][64];
541   __local u32 s_skb[8][64];
542
543   for (u32 i = lid; i < 64; i += lsz)
544   {
545     s_SPtrans[0][i] = c_SPtrans[0][i];
546     s_SPtrans[1][i] = c_SPtrans[1][i];
547     s_SPtrans[2][i] = c_SPtrans[2][i];
548     s_SPtrans[3][i] = c_SPtrans[3][i];
549     s_SPtrans[4][i] = c_SPtrans[4][i];
550     s_SPtrans[5][i] = c_SPtrans[5][i];
551     s_SPtrans[6][i] = c_SPtrans[6][i];
552     s_SPtrans[7][i] = c_SPtrans[7][i];
553
554     s_skb[0][i] = c_skb[0][i];
555     s_skb[1][i] = c_skb[1][i];
556     s_skb[2][i] = c_skb[2][i];
557     s_skb[3][i] = c_skb[3][i];
558     s_skb[4][i] = c_skb[4][i];
559     s_skb[5][i] = c_skb[5][i];
560     s_skb[6][i] = c_skb[6][i];
561     s_skb[7][i] = c_skb[7][i];
562   }
563
564   barrier (CLK_LOCAL_MEM_FENCE);
565
566   if (gid >= gid_max) return;
567
568   /**
569    * base
570    */
571
572   u32 pw_buf0[4];
573
574   pw_buf0[0] = pws[gid].i[ 0];
575   pw_buf0[1] = pws[gid].i[ 1];
576   pw_buf0[2] = 0;
577   pw_buf0[3] = 0;
578
579   u32 pw_buf1[4];
580
581   pw_buf1[0] = 0;
582   pw_buf1[1] = 0;
583   pw_buf1[2] = 0;
584   pw_buf1[3] = 0;
585
586   const u32 pw_len = pws[gid].pw_len;
587
588   /**
589    * salt
590    */
591
592   u32 salt_buf0[2];
593
594   salt_buf0[0] = salt_bufs[salt_pos].salt_buf_pc[0];
595   salt_buf0[1] = salt_bufs[salt_pos].salt_buf_pc[1];
596
597   /**
598    * main
599    */
600
601   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
602   {
603     u32x w0[4] = { 0 };
604     u32x w1[4] = { 0 };
605     u32x w2[4] = { 0 };
606     u32x w3[4] = { 0 };
607
608     u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
609
610     out_len = (out_len >= 8) ? 8 : out_len;
611
612     u32x key[2];
613
614     transform_racf_key (w0[0], w0[1], key);
615
616     const u32x c = key[0];
617     const u32x d = key[1];
618
619     u32x Kc[16];
620     u32x Kd[16];
621
622     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
623
624     u32x data[2];
625
626     data[0] = salt_buf0[0];
627     data[1] = salt_buf0[1];
628
629     volatile u32x iv[2];
630
631     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
632
633     u32x iv2 = 0;
634     u32x iv3 = 0;
635
636     COMPARE_M_SIMD (iv[0], iv[1], iv2, iv3);
637   }
638 }
639
640 __kernel void m08500_m08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
641 {
642 }
643
644 __kernel void m08500_m16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
645 {
646 }
647
648 __kernel void m08500_s04 (__global pw_t *pws, __global kernel_rule_t *  rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 rules_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
649 {
650   /**
651    * base
652    */
653
654   const u32 gid = get_global_id (0);
655   const u32 lid = get_local_id (0);
656   const u32 lsz = get_local_size (0);
657
658   /**
659    * shared
660    */
661
662   __local u32 s_SPtrans[8][64];
663   __local u32 s_skb[8][64];
664
665   for (u32 i = lid; i < 64; i += lsz)
666   {
667     s_SPtrans[0][i] = c_SPtrans[0][i];
668     s_SPtrans[1][i] = c_SPtrans[1][i];
669     s_SPtrans[2][i] = c_SPtrans[2][i];
670     s_SPtrans[3][i] = c_SPtrans[3][i];
671     s_SPtrans[4][i] = c_SPtrans[4][i];
672     s_SPtrans[5][i] = c_SPtrans[5][i];
673     s_SPtrans[6][i] = c_SPtrans[6][i];
674     s_SPtrans[7][i] = c_SPtrans[7][i];
675
676     s_skb[0][i] = c_skb[0][i];
677     s_skb[1][i] = c_skb[1][i];
678     s_skb[2][i] = c_skb[2][i];
679     s_skb[3][i] = c_skb[3][i];
680     s_skb[4][i] = c_skb[4][i];
681     s_skb[5][i] = c_skb[5][i];
682     s_skb[6][i] = c_skb[6][i];
683     s_skb[7][i] = c_skb[7][i];
684   }
685
686   barrier (CLK_LOCAL_MEM_FENCE);
687
688   if (gid >= gid_max) return;
689
690   /**
691    * base
692    */
693
694   u32 pw_buf0[4];
695
696   pw_buf0[0] = pws[gid].i[ 0];
697   pw_buf0[1] = pws[gid].i[ 1];
698   pw_buf0[2] = 0;
699   pw_buf0[3] = 0;
700
701   u32 pw_buf1[4];
702
703   pw_buf1[0] = 0;
704   pw_buf1[1] = 0;
705   pw_buf1[2] = 0;
706   pw_buf1[3] = 0;
707
708   const u32 pw_len = pws[gid].pw_len;
709
710   /**
711    * salt
712    */
713
714   u32 salt_buf0[2];
715
716   salt_buf0[0] = salt_bufs[salt_pos].salt_buf_pc[0];
717   salt_buf0[1] = salt_bufs[salt_pos].salt_buf_pc[1];
718
719   /**
720    * digest
721    */
722
723   const u32 search[4] =
724   {
725     digests_buf[digests_offset].digest_buf[DGST_R0],
726     digests_buf[digests_offset].digest_buf[DGST_R1],
727     digests_buf[digests_offset].digest_buf[DGST_R2],
728     digests_buf[digests_offset].digest_buf[DGST_R3]
729   };
730
731   /**
732    * main
733    */
734
735   for (u32 il_pos = 0; il_pos < rules_cnt; il_pos += VECT_SIZE)
736   {
737     u32x w0[4] = { 0 };
738     u32x w1[4] = { 0 };
739     u32x w2[4] = { 0 };
740     u32x w3[4] = { 0 };
741
742     u32 out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
743
744     out_len = (out_len >= 8) ? 8 : out_len;
745
746     u32x key[2];
747
748     transform_racf_key (w0[0], w0[1], key);
749
750     const u32x c = key[0];
751     const u32x d = key[1];
752
753     u32x Kc[16];
754     u32x Kd[16];
755
756     _des_crypt_keysetup (c, d, Kc, Kd, s_skb);
757
758     u32x data[2];
759
760     data[0] = salt_buf0[0];
761     data[1] = salt_buf0[1];
762
763     volatile u32x iv[2];
764
765     _des_crypt_encrypt (iv, data, Kc, Kd, s_SPtrans);
766
767     u32x iv2 = 0;
768     u32x iv3 = 0;
769
770     COMPARE_S_SIMD (iv[0], iv[1], iv2, iv3);
771   }
772 }
773
774 __kernel void m08500_s08 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
775 {
776 }
777
778 __kernel void m08500_s16 (__global pw_t *pws, __global kernel_rule_t *rules_buf, __global comb_t *combs_buf, __global bf_t *bfs_buf, __global void *tmps, __global void *hooks, __global u32 *bitmaps_buf_s1_a, __global u32 *bitmaps_buf_s1_b, __global u32 *bitmaps_buf_s1_c, __global u32 *bitmaps_buf_s1_d, __global u32 *bitmaps_buf_s2_a, __global u32 *bitmaps_buf_s2_b, __global u32 *bitmaps_buf_s2_c, __global u32 *bitmaps_buf_s2_d, __global plain_t *plains_buf, __global digest_t *digests_buf, __global u32 *hashes_shown, __global salt_t *salt_bufs, __global void *esalt_bufs, __global u32 *d_return_buf, __global u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 combs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
779 {
780 }