Initial commit
[hashcat.git] / nv / m05400_a3.cu
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define _SHA1_
7
8 #include "include/constants.h"
9 #include "include/kernel_vendor.h"
10
11 #ifdef  VLIW1
12 #define VECT_SIZE1
13 #endif
14
15 #ifdef  VLIW2
16 #define VECT_SIZE1
17 #endif
18
19 #define DGST_R0 3
20 #define DGST_R1 4
21 #define DGST_R2 2
22 #define DGST_R3 1
23
24 #include "include/kernel_functions.c"
25 #include "types_nv.c"
26 #include "common_nv.c"
27
28 #ifdef  VECT_SIZE1
29 #define VECT_COMPARE_S "check_single_vect1_comp4.c"
30 #define VECT_COMPARE_M "check_multi_vect1_comp4.c"
31 #endif
32
33 #ifdef  VECT_SIZE2
34 #define VECT_COMPARE_S "check_single_vect2_comp4.c"
35 #define VECT_COMPARE_M "check_multi_vect2_comp4.c"
36 #endif
37
38 #ifdef  VECT_SIZE4
39 #define VECT_COMPARE_S "check_single_vect4_comp4.c"
40 #define VECT_COMPARE_M "check_multi_vect4_comp4.c"
41 #endif
42
43 __device__ static void sha1_transform (const u32x w0[4], const u32x w1[4], const u32x w2[4], const u32x w3[4], u32x digest[5])
44 {
45   u32x A = digest[0];
46   u32x B = digest[1];
47   u32x C = digest[2];
48   u32x D = digest[3];
49   u32x E = digest[4];
50
51   u32x w0_t = w0[0];
52   u32x w1_t = w0[1];
53   u32x w2_t = w0[2];
54   u32x w3_t = w0[3];
55   u32x w4_t = w1[0];
56   u32x w5_t = w1[1];
57   u32x w6_t = w1[2];
58   u32x w7_t = w1[3];
59   u32x w8_t = w2[0];
60   u32x w9_t = w2[1];
61   u32x wa_t = w2[2];
62   u32x wb_t = w2[3];
63   u32x wc_t = w3[0];
64   u32x wd_t = w3[1];
65   u32x we_t = w3[2];
66   u32x wf_t = w3[3];
67
68   #undef K
69   #define K SHA1C00
70
71   SHA1_STEP (SHA1_F0o, A, B, C, D, E, w0_t);
72   SHA1_STEP (SHA1_F0o, E, A, B, C, D, w1_t);
73   SHA1_STEP (SHA1_F0o, D, E, A, B, C, w2_t);
74   SHA1_STEP (SHA1_F0o, C, D, E, A, B, w3_t);
75   SHA1_STEP (SHA1_F0o, B, C, D, E, A, w4_t);
76   SHA1_STEP (SHA1_F0o, A, B, C, D, E, w5_t);
77   SHA1_STEP (SHA1_F0o, E, A, B, C, D, w6_t);
78   SHA1_STEP (SHA1_F0o, D, E, A, B, C, w7_t);
79   SHA1_STEP (SHA1_F0o, C, D, E, A, B, w8_t);
80   SHA1_STEP (SHA1_F0o, B, C, D, E, A, w9_t);
81   SHA1_STEP (SHA1_F0o, A, B, C, D, E, wa_t);
82   SHA1_STEP (SHA1_F0o, E, A, B, C, D, wb_t);
83   SHA1_STEP (SHA1_F0o, D, E, A, B, C, wc_t);
84   SHA1_STEP (SHA1_F0o, C, D, E, A, B, wd_t);
85   SHA1_STEP (SHA1_F0o, B, C, D, E, A, we_t);
86   SHA1_STEP (SHA1_F0o, A, B, C, D, E, wf_t);
87   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F0o, E, A, B, C, D, w0_t);
88   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F0o, D, E, A, B, C, w1_t);
89   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F0o, C, D, E, A, B, w2_t);
90   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F0o, B, C, D, E, A, w3_t);
91
92   #undef K
93   #define K SHA1C01
94
95   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w4_t);
96   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w5_t);
97   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w6_t);
98   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w7_t);
99   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w8_t);
100   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w9_t);
101   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wa_t);
102   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, wb_t);
103   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, wc_t);
104   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wd_t);
105   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, we_t);
106   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wf_t);
107   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w0_t);
108   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w1_t);
109   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w2_t);
110   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w3_t);
111   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w4_t);
112   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w5_t);
113   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w6_t);
114   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w7_t);
115
116   #undef K
117   #define K SHA1C02
118
119   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w8_t);
120   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w9_t);
121   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, wa_t);
122   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, wb_t);
123   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, wc_t);
124   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, wd_t);
125   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, we_t);
126   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, wf_t);
127   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, w0_t);
128   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, w1_t);
129   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w2_t);
130   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w3_t);
131   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, w4_t);
132   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, w5_t);
133   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, w6_t);
134   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F2o, A, B, C, D, E, w7_t);
135   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F2o, E, A, B, C, D, w8_t);
136   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F2o, D, E, A, B, C, w9_t);
137   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F2o, C, D, E, A, B, wa_t);
138   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F2o, B, C, D, E, A, wb_t);
139
140   #undef K
141   #define K SHA1C03
142
143   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, wc_t);
144   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wd_t);
145   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, we_t);
146   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, wf_t);
147   w0_t = rotl32 ((wd_t ^ w8_t ^ w2_t ^ w0_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w0_t);
148   w1_t = rotl32 ((we_t ^ w9_t ^ w3_t ^ w1_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w1_t);
149   w2_t = rotl32 ((wf_t ^ wa_t ^ w4_t ^ w2_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w2_t);
150   w3_t = rotl32 ((w0_t ^ wb_t ^ w5_t ^ w3_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w3_t);
151   w4_t = rotl32 ((w1_t ^ wc_t ^ w6_t ^ w4_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w4_t);
152   w5_t = rotl32 ((w2_t ^ wd_t ^ w7_t ^ w5_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, w5_t);
153   w6_t = rotl32 ((w3_t ^ we_t ^ w8_t ^ w6_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, w6_t);
154   w7_t = rotl32 ((w4_t ^ wf_t ^ w9_t ^ w7_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, w7_t);
155   w8_t = rotl32 ((w5_t ^ w0_t ^ wa_t ^ w8_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, w8_t);
156   w9_t = rotl32 ((w6_t ^ w1_t ^ wb_t ^ w9_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, w9_t);
157   wa_t = rotl32 ((w7_t ^ w2_t ^ wc_t ^ wa_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wa_t);
158   wb_t = rotl32 ((w8_t ^ w3_t ^ wd_t ^ wb_t), 1u); SHA1_STEP (SHA1_F1, A, B, C, D, E, wb_t);
159   wc_t = rotl32 ((w9_t ^ w4_t ^ we_t ^ wc_t), 1u); SHA1_STEP (SHA1_F1, E, A, B, C, D, wc_t);
160   wd_t = rotl32 ((wa_t ^ w5_t ^ wf_t ^ wd_t), 1u); SHA1_STEP (SHA1_F1, D, E, A, B, C, wd_t);
161   we_t = rotl32 ((wb_t ^ w6_t ^ w0_t ^ we_t), 1u); SHA1_STEP (SHA1_F1, C, D, E, A, B, we_t);
162   wf_t = rotl32 ((wc_t ^ w7_t ^ w1_t ^ wf_t), 1u); SHA1_STEP (SHA1_F1, B, C, D, E, A, wf_t);
163
164   digest[0] += A;
165   digest[1] += B;
166   digest[2] += C;
167   digest[3] += D;
168   digest[4] += E;
169 }
170
171 __device__ static void hmac_sha1_pad (u32x w0[4], u32x w1[4], u32x w2[4], u32x w3[4], u32x ipad[5], u32x opad[5])
172 {
173   w0[0] = w0[0] ^ 0x36363636;
174   w0[1] = w0[1] ^ 0x36363636;
175   w0[2] = w0[2] ^ 0x36363636;
176   w0[3] = w0[3] ^ 0x36363636;
177   w1[0] = w1[0] ^ 0x36363636;
178   w1[1] = w1[1] ^ 0x36363636;
179   w1[2] = w1[2] ^ 0x36363636;
180   w1[3] = w1[3] ^ 0x36363636;
181   w2[0] = w2[0] ^ 0x36363636;
182   w2[1] = w2[1] ^ 0x36363636;
183   w2[2] = w2[2] ^ 0x36363636;
184   w2[3] = w2[3] ^ 0x36363636;
185   w3[0] = w3[0] ^ 0x36363636;
186   w3[1] = w3[1] ^ 0x36363636;
187   w3[2] = w3[2] ^ 0x36363636;
188   w3[3] = w3[3] ^ 0x36363636;
189
190   ipad[0] = SHA1M_A;
191   ipad[1] = SHA1M_B;
192   ipad[2] = SHA1M_C;
193   ipad[3] = SHA1M_D;
194   ipad[4] = SHA1M_E;
195
196   sha1_transform (w0, w1, w2, w3, ipad);
197
198   w0[0] = w0[0] ^ 0x6a6a6a6a;
199   w0[1] = w0[1] ^ 0x6a6a6a6a;
200   w0[2] = w0[2] ^ 0x6a6a6a6a;
201   w0[3] = w0[3] ^ 0x6a6a6a6a;
202   w1[0] = w1[0] ^ 0x6a6a6a6a;
203   w1[1] = w1[1] ^ 0x6a6a6a6a;
204   w1[2] = w1[2] ^ 0x6a6a6a6a;
205   w1[3] = w1[3] ^ 0x6a6a6a6a;
206   w2[0] = w2[0] ^ 0x6a6a6a6a;
207   w2[1] = w2[1] ^ 0x6a6a6a6a;
208   w2[2] = w2[2] ^ 0x6a6a6a6a;
209   w2[3] = w2[3] ^ 0x6a6a6a6a;
210   w3[0] = w3[0] ^ 0x6a6a6a6a;
211   w3[1] = w3[1] ^ 0x6a6a6a6a;
212   w3[2] = w3[2] ^ 0x6a6a6a6a;
213   w3[3] = w3[3] ^ 0x6a6a6a6a;
214
215   opad[0] = SHA1M_A;
216   opad[1] = SHA1M_B;
217   opad[2] = SHA1M_C;
218   opad[3] = SHA1M_D;
219   opad[4] = SHA1M_E;
220
221   sha1_transform (w0, w1, w2, w3, opad);
222 }
223
224 __device__ static void hmac_sha1_run (u32x w0[4], u32x w1[4], u32x w2[4], u32x w3[4], u32x ipad[5], u32x opad[5], u32x digest[5])
225 {
226   digest[0] = ipad[0];
227   digest[1] = ipad[1];
228   digest[2] = ipad[2];
229   digest[3] = ipad[3];
230   digest[4] = ipad[4];
231
232   sha1_transform (w0, w1, w2, w3, digest);
233
234   w0[0] = digest[0];
235   w0[1] = digest[1];
236   w0[2] = digest[2];
237   w0[3] = digest[3];
238   w1[0] = digest[4];
239   w1[1] = 0x80000000;
240   w1[2] = 0;
241   w1[3] = 0;
242   w2[0] = 0;
243   w2[1] = 0;
244   w2[2] = 0;
245   w2[3] = 0;
246   w3[0] = 0;
247   w3[1] = 0;
248   w3[2] = 0;
249   w3[3] = (64 + 20) * 8;
250
251   digest[0] = opad[0];
252   digest[1] = opad[1];
253   digest[2] = opad[2];
254   digest[3] = opad[3];
255   digest[4] = opad[4];
256
257   sha1_transform (w0, w1, w2, w3, digest);
258 }
259
260 __device__ __constant__ bf_t c_bfs[1024];
261
262 __device__ static void m05400m (u32x w0[4], u32x w1[4], u32x w2[4], u32x w3[4], const u32 pw_len, const pw_t *pws, const gpu_rule_t *rules_buf, const comb_t *combs_buf, const bf_t *bfs_buf, const void *tmps, void *hooks, const u32 *bitmaps_buf_s1_a, const u32 *bitmaps_buf_s1_b, const u32 *bitmaps_buf_s1_c, const u32 *bitmaps_buf_s1_d, const u32 *bitmaps_buf_s2_a, const u32 *bitmaps_buf_s2_b, const u32 *bitmaps_buf_s2_c, const u32 *bitmaps_buf_s2_d, plain_t *plains_buf, const digest_t *digests_buf, u32 *hashes_shown, const salt_t *salt_bufs, const ikepsk_t *ikepsk_bufs, u32 *d_return_buf, u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, u32 s_msg_buf[128])
263 {
264   /**
265    * modifier
266    */
267
268   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
269   const u32 lid = threadIdx.x;
270
271   /**
272    * salt
273    */
274
275   const u32 nr_len  = ikepsk_bufs[salt_pos].nr_len;
276   const u32 msg_len = ikepsk_bufs[salt_pos].msg_len;
277
278   u32 salt_buf0[4];
279
280   salt_buf0[0] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 0]);
281   salt_buf0[1] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 1]);
282   salt_buf0[2] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 2]);
283   salt_buf0[3] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 3]);
284
285   u32 salt_buf1[4];
286
287   salt_buf1[0] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 4]);
288   salt_buf1[1] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 5]);
289   salt_buf1[2] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 6]);
290   salt_buf1[3] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 7]);
291
292   u32 salt_buf2[4];
293
294   salt_buf2[0] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 8]);
295   salt_buf2[1] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 9]);
296   salt_buf2[2] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[10]);
297   salt_buf2[3] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[11]);
298
299   u32 salt_buf3[4];
300
301   salt_buf3[0] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[12]);
302   salt_buf3[1] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[13]);
303   salt_buf3[2] = 0;
304   salt_buf3[3] = 0;
305
306   /**
307    * loop
308    */
309
310   u32x w0l = w0[0];
311
312   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos++)
313   {
314     const u32 w0r = c_bfs[il_pos].i;
315
316     w0[0] = w0l | w0r;
317
318     /**
319      * pads
320      */
321
322     u32x w0_t[4];
323
324     w0_t[0] = w0[0];
325     w0_t[1] = w0[1];
326     w0_t[2] = w0[2];
327     w0_t[3] = w0[3];
328
329     u32x w1_t[4];
330
331     w1_t[0] = w1[0];
332     w1_t[1] = w1[1];
333     w1_t[2] = w1[2];
334     w1_t[3] = w1[3];
335
336     u32x w2_t[4];
337
338     w2_t[0] = w2[0];
339     w2_t[1] = w2[1];
340     w2_t[2] = w2[2];
341     w2_t[3] = w2[3];
342
343     u32x w3_t[4];
344
345     w3_t[0] = w3[0];
346     w3_t[1] = w3[1];
347     w3_t[2] = 0;
348     w3_t[3] = 0;
349
350     u32x ipad[5];
351     u32x opad[5];
352
353     hmac_sha1_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
354
355     w0_t[0] = salt_buf0[0];
356     w0_t[1] = salt_buf0[1];
357     w0_t[2] = salt_buf0[2];
358     w0_t[3] = salt_buf0[3];
359     w1_t[0] = salt_buf1[0];
360     w1_t[1] = salt_buf1[1];
361     w1_t[2] = salt_buf1[2];
362     w1_t[3] = salt_buf1[3];
363     w2_t[0] = salt_buf2[0];
364     w2_t[1] = salt_buf2[1];
365     w2_t[2] = salt_buf2[2];
366     w2_t[3] = salt_buf2[3];
367     w3_t[0] = salt_buf3[0];
368     w3_t[1] = salt_buf3[1];
369     w3_t[2] = 0;
370     w3_t[3] = (64 + nr_len) * 8;
371
372     u32x digest[5];
373
374     hmac_sha1_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
375
376     w0_t[0] = digest[0];
377     w0_t[1] = digest[1];
378     w0_t[2] = digest[2];
379     w0_t[3] = digest[3];
380     w1_t[0] = digest[4];
381     w1_t[1] = 0;
382     w1_t[2] = 0;
383     w1_t[3] = 0;
384     w2_t[0] = 0;
385     w2_t[1] = 0;
386     w2_t[2] = 0;
387     w2_t[3] = 0;
388     w3_t[0] = 0;
389     w3_t[1] = 0;
390     w3_t[2] = 0;
391     w3_t[3] = 0;
392
393     hmac_sha1_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
394
395     int left;
396     int off;
397
398     for (left = ikepsk_bufs[salt_pos].msg_len, off = 0; left >= 56; left -= 64, off += 16)
399     {
400       w0_t[0] = s_msg_buf[off +  0];
401       w0_t[1] = s_msg_buf[off +  1];
402       w0_t[2] = s_msg_buf[off +  2];
403       w0_t[3] = s_msg_buf[off +  3];
404       w1_t[0] = s_msg_buf[off +  4];
405       w1_t[1] = s_msg_buf[off +  5];
406       w1_t[2] = s_msg_buf[off +  6];
407       w1_t[3] = s_msg_buf[off +  7];
408       w2_t[0] = s_msg_buf[off +  8];
409       w2_t[1] = s_msg_buf[off +  9];
410       w2_t[2] = s_msg_buf[off + 10];
411       w2_t[3] = s_msg_buf[off + 11];
412       w3_t[0] = s_msg_buf[off + 12];
413       w3_t[1] = s_msg_buf[off + 13];
414       w3_t[2] = s_msg_buf[off + 14];
415       w3_t[3] = s_msg_buf[off + 15];
416
417       sha1_transform (w0_t, w1_t, w2_t, w3_t, ipad);
418     }
419
420     w0_t[0] = s_msg_buf[off +  0];
421     w0_t[1] = s_msg_buf[off +  1];
422     w0_t[2] = s_msg_buf[off +  2];
423     w0_t[3] = s_msg_buf[off +  3];
424     w1_t[0] = s_msg_buf[off +  4];
425     w1_t[1] = s_msg_buf[off +  5];
426     w1_t[2] = s_msg_buf[off +  6];
427     w1_t[3] = s_msg_buf[off +  7];
428     w2_t[0] = s_msg_buf[off +  8];
429     w2_t[1] = s_msg_buf[off +  9];
430     w2_t[2] = s_msg_buf[off + 10];
431     w2_t[3] = s_msg_buf[off + 11];
432     w3_t[0] = s_msg_buf[off + 12];
433     w3_t[1] = s_msg_buf[off + 13];
434     w3_t[2] = 0;
435     w3_t[3] = (64 + msg_len) * 8;
436
437     hmac_sha1_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
438
439     const u32x r0 = digest[3];
440     const u32x r1 = digest[4];
441     const u32x r2 = digest[2];
442     const u32x r3 = digest[1];
443
444     #include VECT_COMPARE_M
445   }
446 }
447
448 __device__ static void m05400s (u32x w0[4], u32x w1[4], u32x w2[4], u32x w3[4], const u32 pw_len, const pw_t *pws, const gpu_rule_t *rules_buf, const comb_t *combs_buf, const bf_t *bfs_buf, const void *tmps, void *hooks, const u32 *bitmaps_buf_s1_a, const u32 *bitmaps_buf_s1_b, const u32 *bitmaps_buf_s1_c, const u32 *bitmaps_buf_s1_d, const u32 *bitmaps_buf_s2_a, const u32 *bitmaps_buf_s2_b, const u32 *bitmaps_buf_s2_c, const u32 *bitmaps_buf_s2_d, plain_t *plains_buf, const digest_t *digests_buf, u32 *hashes_shown, const salt_t *salt_bufs, const ikepsk_t *ikepsk_bufs, u32 *d_return_buf, u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, u32 s_msg_buf[128])
449 {
450   /**
451    * modifier
452    */
453
454   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
455   const u32 lid = threadIdx.x;
456
457   /**
458    * salt
459    */
460
461   const u32 nr_len  = ikepsk_bufs[salt_pos].nr_len;
462   const u32 msg_len = ikepsk_bufs[salt_pos].msg_len;
463
464   u32 salt_buf0[4];
465
466   salt_buf0[0] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 0]);
467   salt_buf0[1] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 1]);
468   salt_buf0[2] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 2]);
469   salt_buf0[3] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 3]);
470
471   u32 salt_buf1[4];
472
473   salt_buf1[0] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 4]);
474   salt_buf1[1] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 5]);
475   salt_buf1[2] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 6]);
476   salt_buf1[3] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 7]);
477
478   u32 salt_buf2[4];
479
480   salt_buf2[0] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 8]);
481   salt_buf2[1] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[ 9]);
482   salt_buf2[2] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[10]);
483   salt_buf2[3] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[11]);
484
485   u32 salt_buf3[4];
486
487   salt_buf3[0] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[12]);
488   salt_buf3[1] = swap_workaround (ikepsk_bufs[salt_pos].nr_buf[13]);
489   salt_buf3[2] = 0;
490   salt_buf3[3] = 0;
491
492   /**
493    * digest
494    */
495
496   const u32 search[4] =
497   {
498     digests_buf[digests_offset].digest_buf[DGST_R0],
499     digests_buf[digests_offset].digest_buf[DGST_R1],
500     digests_buf[digests_offset].digest_buf[DGST_R2],
501     digests_buf[digests_offset].digest_buf[DGST_R3]
502   };
503
504   /**
505    * loop
506    */
507
508   u32x w0l = w0[0];
509
510   for (u32 il_pos = 0; il_pos < bfs_cnt; il_pos++)
511   {
512     const u32 w0r = c_bfs[il_pos].i;
513
514     w0[0] = w0l | w0r;
515
516     /**
517      * pads
518      */
519
520     u32x w0_t[4];
521
522     w0_t[0] = w0[0];
523     w0_t[1] = w0[1];
524     w0_t[2] = w0[2];
525     w0_t[3] = w0[3];
526
527     u32x w1_t[4];
528
529     w1_t[0] = w1[0];
530     w1_t[1] = w1[1];
531     w1_t[2] = w1[2];
532     w1_t[3] = w1[3];
533
534     u32x w2_t[4];
535
536     w2_t[0] = w2[0];
537     w2_t[1] = w2[1];
538     w2_t[2] = w2[2];
539     w2_t[3] = w2[3];
540
541     u32x w3_t[4];
542
543     w3_t[0] = w3[0];
544     w3_t[1] = w3[1];
545     w3_t[2] = 0;
546     w3_t[3] = 0;
547
548     u32x ipad[5];
549     u32x opad[5];
550
551     hmac_sha1_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
552
553     w0_t[0] = salt_buf0[0];
554     w0_t[1] = salt_buf0[1];
555     w0_t[2] = salt_buf0[2];
556     w0_t[3] = salt_buf0[3];
557     w1_t[0] = salt_buf1[0];
558     w1_t[1] = salt_buf1[1];
559     w1_t[2] = salt_buf1[2];
560     w1_t[3] = salt_buf1[3];
561     w2_t[0] = salt_buf2[0];
562     w2_t[1] = salt_buf2[1];
563     w2_t[2] = salt_buf2[2];
564     w2_t[3] = salt_buf2[3];
565     w3_t[0] = salt_buf3[0];
566     w3_t[1] = salt_buf3[1];
567     w3_t[2] = 0;
568     w3_t[3] = (64 + nr_len) * 8;
569
570     u32x digest[5];
571
572     hmac_sha1_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
573
574     w0_t[0] = digest[0];
575     w0_t[1] = digest[1];
576     w0_t[2] = digest[2];
577     w0_t[3] = digest[3];
578     w1_t[0] = digest[4];
579     w1_t[1] = 0;
580     w1_t[2] = 0;
581     w1_t[3] = 0;
582     w2_t[0] = 0;
583     w2_t[1] = 0;
584     w2_t[2] = 0;
585     w2_t[3] = 0;
586     w3_t[0] = 0;
587     w3_t[1] = 0;
588     w3_t[2] = 0;
589     w3_t[3] = 0;
590
591     hmac_sha1_pad (w0_t, w1_t, w2_t, w3_t, ipad, opad);
592
593     int left;
594     int off;
595
596     for (left = ikepsk_bufs[salt_pos].msg_len, off = 0; left >= 56; left -= 64, off += 16)
597     {
598       w0_t[0] = s_msg_buf[off +  0];
599       w0_t[1] = s_msg_buf[off +  1];
600       w0_t[2] = s_msg_buf[off +  2];
601       w0_t[3] = s_msg_buf[off +  3];
602       w1_t[0] = s_msg_buf[off +  4];
603       w1_t[1] = s_msg_buf[off +  5];
604       w1_t[2] = s_msg_buf[off +  6];
605       w1_t[3] = s_msg_buf[off +  7];
606       w2_t[0] = s_msg_buf[off +  8];
607       w2_t[1] = s_msg_buf[off +  9];
608       w2_t[2] = s_msg_buf[off + 10];
609       w2_t[3] = s_msg_buf[off + 11];
610       w3_t[0] = s_msg_buf[off + 12];
611       w3_t[1] = s_msg_buf[off + 13];
612       w3_t[2] = s_msg_buf[off + 14];
613       w3_t[3] = s_msg_buf[off + 15];
614
615       sha1_transform (w0_t, w1_t, w2_t, w3_t, ipad);
616     }
617
618     w0_t[0] = s_msg_buf[off +  0];
619     w0_t[1] = s_msg_buf[off +  1];
620     w0_t[2] = s_msg_buf[off +  2];
621     w0_t[3] = s_msg_buf[off +  3];
622     w1_t[0] = s_msg_buf[off +  4];
623     w1_t[1] = s_msg_buf[off +  5];
624     w1_t[2] = s_msg_buf[off +  6];
625     w1_t[3] = s_msg_buf[off +  7];
626     w2_t[0] = s_msg_buf[off +  8];
627     w2_t[1] = s_msg_buf[off +  9];
628     w2_t[2] = s_msg_buf[off + 10];
629     w2_t[3] = s_msg_buf[off + 11];
630     w3_t[0] = s_msg_buf[off + 12];
631     w3_t[1] = s_msg_buf[off + 13];
632     w3_t[2] = 0;
633     w3_t[3] = (64 + msg_len) * 8;
634
635     hmac_sha1_run (w0_t, w1_t, w2_t, w3_t, ipad, opad, digest);
636
637     const u32x r0 = digest[3];
638     const u32x r1 = digest[4];
639     const u32x r2 = digest[2];
640     const u32x r3 = digest[1];
641
642     #include VECT_COMPARE_S
643   }
644 }
645
646 extern "C" __global__ void __launch_bounds__ (256, 1) m05400_m04 (const pw_t *pws, const gpu_rule_t *rules_buf, const comb_t *combs_buf, const bf_t *bfs_buf, const void *tmps, void *hooks, const u32 *bitmaps_buf_s1_a, const u32 *bitmaps_buf_s1_b, const u32 *bitmaps_buf_s1_c, const u32 *bitmaps_buf_s1_d, const u32 *bitmaps_buf_s2_a, const u32 *bitmaps_buf_s2_b, const u32 *bitmaps_buf_s2_c, const u32 *bitmaps_buf_s2_d, plain_t *plains_buf, const digest_t *digests_buf, u32 *hashes_shown, const salt_t *salt_bufs, const ikepsk_t *ikepsk_bufs, u32 *d_return_buf, u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
647 {
648   /**
649    * base
650    */
651
652   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
653   const u32 lid = threadIdx.x;
654
655   u32x w0[4];
656
657   w0[0] = pws[gid].i[ 0];
658   w0[1] = pws[gid].i[ 1];
659   w0[2] = pws[gid].i[ 2];
660   w0[3] = pws[gid].i[ 3];
661
662   u32x w1[4];
663
664   w1[0] = 0;
665   w1[1] = 0;
666   w1[2] = 0;
667   w1[3] = 0;
668
669   u32x w2[4];
670
671   w2[0] = 0;
672   w2[1] = 0;
673   w2[2] = 0;
674   w2[3] = 0;
675
676   u32x w3[4];
677
678   w3[0] = 0;
679   w3[1] = 0;
680   w3[2] = 0;
681   w3[3] = 0;
682
683   const u32 pw_len = pws[gid].pw_len;
684
685   /**
686    * s_msg
687    */
688
689   __shared__ u32 s_msg_buf[128];
690
691   if (lid < 128)
692   {
693     s_msg_buf[lid] = swap_workaround (ikepsk_bufs[salt_pos].msg_buf[lid]);
694   }
695
696   __syncthreads ();
697
698   if (gid >= gid_max) return;
699
700   /**
701    * main
702    */
703
704   m05400m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
705 }
706
707 extern "C" __global__ void __launch_bounds__ (256, 1) m05400_m08 (const pw_t *pws, const gpu_rule_t *rules_buf, const comb_t *combs_buf, const bf_t *bfs_buf, const void *tmps, void *hooks, const u32 *bitmaps_buf_s1_a, const u32 *bitmaps_buf_s1_b, const u32 *bitmaps_buf_s1_c, const u32 *bitmaps_buf_s1_d, const u32 *bitmaps_buf_s2_a, const u32 *bitmaps_buf_s2_b, const u32 *bitmaps_buf_s2_c, const u32 *bitmaps_buf_s2_d, plain_t *plains_buf, const digest_t *digests_buf, u32 *hashes_shown, const salt_t *salt_bufs, const ikepsk_t *ikepsk_bufs, u32 *d_return_buf, u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
708 {
709   /**
710    * base
711    */
712
713   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
714   const u32 lid = threadIdx.x;
715
716   u32x w0[4];
717
718   w0[0] = pws[gid].i[ 0];
719   w0[1] = pws[gid].i[ 1];
720   w0[2] = pws[gid].i[ 2];
721   w0[3] = pws[gid].i[ 3];
722
723   u32x w1[4];
724
725   w1[0] = pws[gid].i[ 4];
726   w1[1] = pws[gid].i[ 5];
727   w1[2] = pws[gid].i[ 6];
728   w1[3] = pws[gid].i[ 7];
729
730   u32x w2[4];
731
732   w2[0] = 0;
733   w2[1] = 0;
734   w2[2] = 0;
735   w2[3] = 0;
736
737   u32x w3[4];
738
739   w3[0] = 0;
740   w3[1] = 0;
741   w3[2] = 0;
742   w3[3] = 0;
743
744   const u32 pw_len = pws[gid].pw_len;
745
746   /**
747    * s_msg
748    */
749
750   __shared__ u32 s_msg_buf[128];
751
752   if (lid < 128)
753   {
754     s_msg_buf[lid] = swap_workaround (ikepsk_bufs[salt_pos].msg_buf[lid]);
755   }
756
757   __syncthreads ();
758
759   if (gid >= gid_max) return;
760
761   /**
762    * main
763    */
764
765   m05400m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
766 }
767
768 extern "C" __global__ void __launch_bounds__ (256, 1) m05400_m16 (const pw_t *pws, const gpu_rule_t *rules_buf, const comb_t *combs_buf, const bf_t *bfs_buf, const void *tmps, void *hooks, const u32 *bitmaps_buf_s1_a, const u32 *bitmaps_buf_s1_b, const u32 *bitmaps_buf_s1_c, const u32 *bitmaps_buf_s1_d, const u32 *bitmaps_buf_s2_a, const u32 *bitmaps_buf_s2_b, const u32 *bitmaps_buf_s2_c, const u32 *bitmaps_buf_s2_d, plain_t *plains_buf, const digest_t *digests_buf, u32 *hashes_shown, const salt_t *salt_bufs, const ikepsk_t *ikepsk_bufs, u32 *d_return_buf, u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
769 {
770   /**
771    * base
772    */
773
774   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
775   const u32 lid = threadIdx.x;
776
777   u32x w0[4];
778
779   w0[0] = pws[gid].i[ 0];
780   w0[1] = pws[gid].i[ 1];
781   w0[2] = pws[gid].i[ 2];
782   w0[3] = pws[gid].i[ 3];
783
784   u32x w1[4];
785
786   w1[0] = pws[gid].i[ 4];
787   w1[1] = pws[gid].i[ 5];
788   w1[2] = pws[gid].i[ 6];
789   w1[3] = pws[gid].i[ 7];
790
791   u32x w2[4];
792
793   w2[0] = pws[gid].i[ 8];
794   w2[1] = pws[gid].i[ 9];
795   w2[2] = pws[gid].i[10];
796   w2[3] = pws[gid].i[11];
797
798   u32x w3[4];
799
800   w3[0] = pws[gid].i[12];
801   w3[1] = pws[gid].i[13];
802   w3[2] = 0;
803   w3[3] = 0;
804
805   const u32 pw_len = pws[gid].pw_len;
806
807   /**
808    * s_msg
809    */
810
811   __shared__ u32 s_msg_buf[128];
812
813   if (lid < 128)
814   {
815     s_msg_buf[lid] = swap_workaround (ikepsk_bufs[salt_pos].msg_buf[lid]);
816   }
817
818   __syncthreads ();
819
820   if (gid >= gid_max) return;
821
822   /**
823    * main
824    */
825
826   m05400m (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
827 }
828
829 extern "C" __global__ void __launch_bounds__ (256, 1) m05400_s04 (const pw_t *pws, const gpu_rule_t *rules_buf, const comb_t *combs_buf, const bf_t *bfs_buf, const void *tmps, void *hooks, const u32 *bitmaps_buf_s1_a, const u32 *bitmaps_buf_s1_b, const u32 *bitmaps_buf_s1_c, const u32 *bitmaps_buf_s1_d, const u32 *bitmaps_buf_s2_a, const u32 *bitmaps_buf_s2_b, const u32 *bitmaps_buf_s2_c, const u32 *bitmaps_buf_s2_d, plain_t *plains_buf, const digest_t *digests_buf, u32 *hashes_shown, const salt_t *salt_bufs, const ikepsk_t *ikepsk_bufs, u32 *d_return_buf, u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
830 {
831   /**
832    * base
833    */
834
835   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
836   const u32 lid = threadIdx.x;
837
838   u32x w0[4];
839
840   w0[0] = pws[gid].i[ 0];
841   w0[1] = pws[gid].i[ 1];
842   w0[2] = pws[gid].i[ 2];
843   w0[3] = pws[gid].i[ 3];
844
845   u32x w1[4];
846
847   w1[0] = 0;
848   w1[1] = 0;
849   w1[2] = 0;
850   w1[3] = 0;
851
852   u32x w2[4];
853
854   w2[0] = 0;
855   w2[1] = 0;
856   w2[2] = 0;
857   w2[3] = 0;
858
859   u32x w3[4];
860
861   w3[0] = 0;
862   w3[1] = 0;
863   w3[2] = 0;
864   w3[3] = 0;
865
866   const u32 pw_len = pws[gid].pw_len;
867
868   /**
869    * s_msg
870    */
871
872   __shared__ u32 s_msg_buf[128];
873
874   if (lid < 128)
875   {
876     s_msg_buf[lid] = swap_workaround (ikepsk_bufs[salt_pos].msg_buf[lid]);
877   }
878
879   __syncthreads ();
880
881   if (gid >= gid_max) return;
882
883   /**
884    * main
885    */
886
887   m05400s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
888 }
889
890 extern "C" __global__ void __launch_bounds__ (256, 1) m05400_s08 (const pw_t *pws, const gpu_rule_t *rules_buf, const comb_t *combs_buf, const bf_t *bfs_buf, const void *tmps, void *hooks, const u32 *bitmaps_buf_s1_a, const u32 *bitmaps_buf_s1_b, const u32 *bitmaps_buf_s1_c, const u32 *bitmaps_buf_s1_d, const u32 *bitmaps_buf_s2_a, const u32 *bitmaps_buf_s2_b, const u32 *bitmaps_buf_s2_c, const u32 *bitmaps_buf_s2_d, plain_t *plains_buf, const digest_t *digests_buf, u32 *hashes_shown, const salt_t *salt_bufs, const ikepsk_t *ikepsk_bufs, u32 *d_return_buf, u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
891 {
892   /**
893    * base
894    */
895
896   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
897   const u32 lid = threadIdx.x;
898
899   u32x w0[4];
900
901   w0[0] = pws[gid].i[ 0];
902   w0[1] = pws[gid].i[ 1];
903   w0[2] = pws[gid].i[ 2];
904   w0[3] = pws[gid].i[ 3];
905
906   u32x w1[4];
907
908   w1[0] = pws[gid].i[ 4];
909   w1[1] = pws[gid].i[ 5];
910   w1[2] = pws[gid].i[ 6];
911   w1[3] = pws[gid].i[ 7];
912
913   u32x w2[4];
914
915   w2[0] = 0;
916   w2[1] = 0;
917   w2[2] = 0;
918   w2[3] = 0;
919
920   u32x w3[4];
921
922   w3[0] = 0;
923   w3[1] = 0;
924   w3[2] = 0;
925   w3[3] = 0;
926
927   const u32 pw_len = pws[gid].pw_len;
928
929   /**
930    * s_msg
931    */
932
933   __shared__ u32 s_msg_buf[128];
934
935   if (lid < 128)
936   {
937     s_msg_buf[lid] = swap_workaround (ikepsk_bufs[salt_pos].msg_buf[lid]);
938   }
939
940   __syncthreads ();
941
942   if (gid >= gid_max) return;
943
944   /**
945    * main
946    */
947
948   m05400s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
949 }
950
951 extern "C" __global__ void __launch_bounds__ (256, 1) m05400_s16 (const pw_t *pws, const gpu_rule_t *rules_buf, const comb_t *combs_buf, const bf_t *bfs_buf, const void *tmps, void *hooks, const u32 *bitmaps_buf_s1_a, const u32 *bitmaps_buf_s1_b, const u32 *bitmaps_buf_s1_c, const u32 *bitmaps_buf_s1_d, const u32 *bitmaps_buf_s2_a, const u32 *bitmaps_buf_s2_b, const u32 *bitmaps_buf_s2_c, const u32 *bitmaps_buf_s2_d, plain_t *plains_buf, const digest_t *digests_buf, u32 *hashes_shown, const salt_t *salt_bufs, const ikepsk_t *ikepsk_bufs, u32 *d_return_buf, u32 *d_scryptV_buf, const u32 bitmap_mask, const u32 bitmap_shift1, const u32 bitmap_shift2, const u32 salt_pos, const u32 loop_pos, const u32 loop_cnt, const u32 bfs_cnt, const u32 digests_cnt, const u32 digests_offset, const u32 combs_mode, const u32 gid_max)
952 {
953   /**
954    * base
955    */
956
957   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
958   const u32 lid = threadIdx.x;
959
960   u32x w0[4];
961
962   w0[0] = pws[gid].i[ 0];
963   w0[1] = pws[gid].i[ 1];
964   w0[2] = pws[gid].i[ 2];
965   w0[3] = pws[gid].i[ 3];
966
967   u32x w1[4];
968
969   w1[0] = pws[gid].i[ 4];
970   w1[1] = pws[gid].i[ 5];
971   w1[2] = pws[gid].i[ 6];
972   w1[3] = pws[gid].i[ 7];
973
974   u32x w2[4];
975
976   w2[0] = pws[gid].i[ 8];
977   w2[1] = pws[gid].i[ 9];
978   w2[2] = pws[gid].i[10];
979   w2[3] = pws[gid].i[11];
980
981   u32x w3[4];
982
983   w3[0] = pws[gid].i[12];
984   w3[1] = pws[gid].i[13];
985   w3[2] = 0;
986   w3[3] = 0;
987
988   const u32 pw_len = pws[gid].pw_len;
989
990   /**
991    * s_msg
992    */
993
994   __shared__ u32 s_msg_buf[128];
995
996   if (lid < 128)
997   {
998     s_msg_buf[lid] = swap_workaround (ikepsk_bufs[salt_pos].msg_buf[lid]);
999   }
1000
1001   __syncthreads ();
1002
1003   if (gid >= gid_max) return;
1004
1005   /**
1006    * main
1007    */
1008
1009   m05400s (w0, w1, w2, w3, pw_len, pws, rules_buf, combs_buf, bfs_buf, tmps, hooks, bitmaps_buf_s1_a, bitmaps_buf_s1_b, bitmaps_buf_s1_c, bitmaps_buf_s1_d, bitmaps_buf_s2_a, bitmaps_buf_s2_b, bitmaps_buf_s2_c, bitmaps_buf_s2_d, plains_buf, digests_buf, hashes_shown, salt_bufs, ikepsk_bufs, d_return_buf, d_scryptV_buf, bitmap_mask, bitmap_shift1, bitmap_shift2, salt_pos, loop_pos, loop_cnt, bfs_cnt, digests_cnt, digests_offset, s_msg_buf);
1010 }