Initial commit
[hashcat.git] / nv / markov_be_v1.cu
1 /**
2  * Author......: Jens Steube <jens.steube@gmail.com>
3  * License.....: MIT
4  */
5
6 #define CHARSIZ 256
7
8 #define VECT_SIZE1
9
10 #include "types_nv.c"
11
12 __device__ static void generate_pw (u32 pw_buf[16], cs_t *root_css_buf, cs_t *markov_css_buf, const u32 pw_l_len, const u32 pw_r_len, const u32 mask80, const u32 bits14, const u32 bits15, u64 val)
13 {
14   pw_buf[ 0] = 0;
15   pw_buf[ 1] = 0;
16   pw_buf[ 2] = 0;
17   pw_buf[ 3] = 0;
18   pw_buf[ 4] = 0;
19   pw_buf[ 5] = 0;
20   pw_buf[ 6] = 0;
21   pw_buf[ 7] = 0;
22   pw_buf[ 8] = 0;
23   pw_buf[ 9] = 0;
24   pw_buf[10] = 0;
25   pw_buf[11] = 0;
26   pw_buf[12] = 0;
27   pw_buf[13] = 0;
28   pw_buf[14] = 0;
29   pw_buf[15] = 0;
30
31   cs_t *cs = &root_css_buf[pw_r_len];
32
33   u32 i;
34   u32 j;
35
36   for (i = 0, j = pw_r_len; i < pw_l_len; i++, j++)
37   {
38     const u32 len = cs->cs_len;
39
40     const u64 next = val / len;
41     const u64 pos  = val % len;
42
43     val = next;
44
45     const u32 key = cs->cs_buf[pos];
46
47     const u32 jd4 = j / 4;
48     const u32 jm4 = j % 4;
49
50     pw_buf[jd4] |= key << ((3 - jm4) * 8);
51
52     cs = &markov_css_buf[(j * CHARSIZ) + key];
53   }
54
55   const u32 jd4 = j / 4;
56   const u32 jm4 = j % 4;
57
58   pw_buf[jd4] |= (0xff << ((3 - jm4) * 8)) & mask80;
59
60   if (bits14) pw_buf[14] = (pw_l_len + pw_r_len) * 8;
61   if (bits15) pw_buf[15] = (pw_l_len + pw_r_len) * 8;
62 }
63
64 extern "C" __global__ void __launch_bounds__ (256, 1) l_markov (pw_t *pws_buf_l, cs_t *root_css_buf, cs_t *markov_css_buf, const u64 off, const u32 pw_l_len, const u32 pw_r_len, const u32 mask80, const u32 bits14, const u32 bits15, const u32 gid_max)
65 {
66   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
67
68   if (gid >= gid_max) return;
69
70   u32 pw_buf[16];
71
72   generate_pw (pw_buf, root_css_buf, markov_css_buf, pw_l_len, pw_r_len, mask80, bits14, bits15, off + gid);
73
74   pws_buf_l[gid].i[ 0] = pw_buf[ 0];
75   pws_buf_l[gid].i[ 1] = pw_buf[ 1];
76   pws_buf_l[gid].i[ 2] = pw_buf[ 2];
77   pws_buf_l[gid].i[ 3] = pw_buf[ 3];
78   pws_buf_l[gid].i[ 4] = pw_buf[ 4];
79   pws_buf_l[gid].i[ 5] = pw_buf[ 5];
80   pws_buf_l[gid].i[ 6] = pw_buf[ 6];
81   pws_buf_l[gid].i[ 7] = pw_buf[ 7];
82   pws_buf_l[gid].i[ 8] = pw_buf[ 8];
83   pws_buf_l[gid].i[ 9] = pw_buf[ 9];
84   pws_buf_l[gid].i[10] = pw_buf[10];
85   pws_buf_l[gid].i[11] = pw_buf[11];
86   pws_buf_l[gid].i[12] = pw_buf[12];
87   pws_buf_l[gid].i[13] = pw_buf[13];
88   pws_buf_l[gid].i[14] = pw_buf[14];
89   pws_buf_l[gid].i[15] = pw_buf[15];
90
91   pws_buf_l[gid].pw_len = pw_l_len + pw_r_len;
92 }
93
94 extern "C" __global__ void __launch_bounds__ (256, 1) r_markov (bf_t *pws_buf_r, cs_t *root_css_buf, cs_t *markov_css_buf, const u64 off, const u32 pw_r_len, const u32 mask80, const u32 bits14, const u32 bits15, const u32 gid_max)
95 {
96   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
97
98   if (gid >= gid_max) return;
99
100   u32 pw_buf[16];
101
102   generate_pw (pw_buf, root_css_buf, markov_css_buf, pw_r_len, 0, 0, 0, 0, off + gid);
103
104   pws_buf_r[gid].i = pw_buf[0];
105 }
106
107 extern "C" __global__ void __launch_bounds__ (256, 1) C_markov (comb_t *pws_buf, cs_t *root_css_buf, cs_t *markov_css_buf, const u64 off, const u32 pw_len, const u32 mask80, const u32 bits14, const u32 bits15, const u32 gid_max)
108 {
109   const u32 gid = (blockIdx.x * blockDim.x) + threadIdx.x;
110
111   if (gid >= gid_max) return;
112
113   u32 pw_buf[16];
114
115   generate_pw (pw_buf, root_css_buf, markov_css_buf, pw_len, 0, mask80, bits14, bits15, off + gid);
116
117   pws_buf[gid].i[ 0] = pw_buf[ 0];
118   pws_buf[gid].i[ 1] = pw_buf[ 1];
119   pws_buf[gid].i[ 2] = pw_buf[ 2];
120   pws_buf[gid].i[ 3] = pw_buf[ 3];
121   pws_buf[gid].i[ 4] = pw_buf[ 4];
122   pws_buf[gid].i[ 5] = pw_buf[ 5];
123   pws_buf[gid].i[ 6] = pw_buf[ 6];
124   pws_buf[gid].i[ 7] = pw_buf[ 7];
125
126   pws_buf[gid].pw_len = pw_len;
127 }