Fix a bug in -m 1500, returned invalid plain is cracking slice was not 0

[hashcat.git] / OpenCL / m08000_a0.cl
diff --git a/OpenCL/m08000_a0.cl b/OpenCL/m08000_a0.cl

index 50104e8..046b84e 100644 (file)
--- a/OpenCL/m08000_a0.cl
+++ b/OpenCL/m08000_a0.cl
@@ -9,20 +9,20 @@
  
  #define NEW_SIMD_CODE
  
-#include "include/constants.h"
-#include "include/kernel_vendor.h"
+#include "inc_hash_constants.h"
+#include "inc_vendor.cl"
  
  #define DGST_R0 3
  #define DGST_R1 7
  #define DGST_R2 2
  #define DGST_R3 6
  
-#include "include/kernel_functions.c"
-#include "OpenCL/types_ocl.c"
-#include "OpenCL/common.c"
-#include "include/rp_kernel.h"
-#include "OpenCL/rp.c"
-#include "OpenCL/simd.c"
+#include "inc_hash_functions.cl"
+#include "inc_types.cl"
+#include "inc_common.cl"
+#include "inc_rp.h"
+#include "inc_rp.cl"
+#include "inc_simd.cl"
  
  __constant u32 k_sha256[64] =
  {
@@ -49,7 +49,7 @@ __constant u32 k_sha256[64] =
  
  #define SHA256_EXPAND_S(x,y,z,w) (SHA256_S1_S (x) + y + SHA256_S0_S (z) + w)
  
-static void sha256_transform (u32x digest[8], const u32x w[16])
+void sha256_transform (u32x digest[8], const u32x w[16])
  {
    u32x a = digest[0];
    u32x b = digest[1];
@@ -119,7 +119,9 @@ static void sha256_transform (u32x digest[8], const u32x w[16])
  
    ROUND_STEP (0);
  
+  #ifdef _unroll
    #pragma unroll
+  #endif
    for (int i = 16; i < 64; i += 16)
    {
      ROUND_EXPAND (); ROUND_STEP (i);
@@ -135,7 +137,7 @@ static void sha256_transform (u32x digest[8], const u32x w[16])
    digest[7] += h;
  }
  
-static void sha256_transform_z (u32x digest[8])
+void sha256_transform_z (u32x digest[8])
  {
    u32x a = digest[0];
    u32x b = digest[1];
@@ -168,7 +170,9 @@ static void sha256_transform_z (u32x digest[8])
  
    ROUND_STEP_Z (0);
  
+  #ifdef _unroll
    #pragma unroll
+  #endif
    for (int i = 16; i < 64; i += 16)
    {
      ROUND_STEP_Z (i);
@@ -184,7 +188,7 @@ static void sha256_transform_z (u32x digest[8])
    digest[7] += h;
  }
  
-static void sha256_transform_s (u32x digest[8], __local u32 *w)
+void sha256_transform_s (u32x digest[8], __local u32 *w)
  {
    u32x a = digest[0];
    u32x b = digest[1];
@@ -217,7 +221,9 @@ static void sha256_transform_s (u32x digest[8], __local u32 *w)
  
    ROUND_STEP_S (0);
  
+  #ifdef _unroll
    #pragma unroll
+  #endif
    for (int i = 16; i < 64; i += 16)
    {
      ROUND_STEP_S (i);
@@ -270,7 +276,9 @@ __kernel void m08000_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
    {
      w_s1[15] =               0 | salt_buf0 >> 16;
  
+    #ifdef _unroll
      #pragma unroll
+    #endif
      for (int i = 16; i < 64; i++)
      {
        w_s1[i] = SHA256_EXPAND_S (w_s1[i - 2], w_s1[i - 7], w_s1[i - 15], w_s1[i - 16]);
@@ -281,7 +289,9 @@ __kernel void m08000_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
      w_s2[ 2] = salt_buf2 << 16 | 0;
      w_s2[15] = (510 + 8) * 8;
  
+    #ifdef _unroll
      #pragma unroll
+    #endif
      for (int i = 16; i < 64; i++)
      {
        w_s2[i] = SHA256_EXPAND_S (w_s2[i - 2], w_s2[i - 7], w_s2[i - 15], w_s2[i - 16]);
@@ -297,14 +307,12 @@ __kernel void m08000_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
     */
  
    u32 pw_buf0[4];
+  u32 pw_buf1[4];
  
    pw_buf0[0] = pws[gid].i[ 0];
    pw_buf0[1] = pws[gid].i[ 1];
    pw_buf0[2] = pws[gid].i[ 2];
    pw_buf0[3] = pws[gid].i[ 3];
-
-  u32 pw_buf1[4];
-
    pw_buf1[0] = pws[gid].i[ 4];
    pw_buf1[1] = pws[gid].i[ 5];
    pw_buf1[2] = pws[gid].i[ 6];
@@ -323,7 +331,7 @@ __kernel void m08000_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
      u32x w2[4] = { 0 };
      u32x w3[4] = { 0 };
  
-    const u32x out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
+    apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
  
      u32x w0_t[4];
      u32x w1_t[4];
@@ -331,7 +339,6 @@ __kernel void m08000_m04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
      u32x w3_t[4];
  
      make_unicode (w0, w0_t, w1_t);
-
      make_unicode (w1, w2_t, w3_t);
  
      u32x w_t[16];
@@ -440,7 +447,9 @@ __kernel void m08000_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
    {
      w_s1[15] =               0 | salt_buf0 >> 16;
  
+    #ifdef _unroll
      #pragma unroll
+    #endif
      for (int i = 16; i < 64; i++)
      {
        w_s1[i] = SHA256_EXPAND_S (w_s1[i - 2], w_s1[i - 7], w_s1[i - 15], w_s1[i - 16]);
@@ -451,7 +460,9 @@ __kernel void m08000_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
      w_s2[ 2] = salt_buf2 << 16 | 0;
      w_s2[15] = (510 + 8) * 8;
  
+    #ifdef _unroll
      #pragma unroll
+    #endif
      for (int i = 16; i < 64; i++)
      {
        w_s2[i] = SHA256_EXPAND_S (w_s2[i - 2], w_s2[i - 7], w_s2[i - 15], w_s2[i - 16]);
@@ -467,14 +478,12 @@ __kernel void m08000_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
     */
  
    u32 pw_buf0[4];
+  u32 pw_buf1[4];
  
    pw_buf0[0] = pws[gid].i[ 0];
    pw_buf0[1] = pws[gid].i[ 1];
    pw_buf0[2] = pws[gid].i[ 2];
    pw_buf0[3] = pws[gid].i[ 3];
-
-  u32 pw_buf1[4];
-
    pw_buf1[0] = pws[gid].i[ 4];
    pw_buf1[1] = pws[gid].i[ 5];
    pw_buf1[2] = pws[gid].i[ 6];
@@ -505,7 +514,7 @@ __kernel void m08000_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
      u32x w2[4] = { 0 };
      u32x w3[4] = { 0 };
  
-    const u32x out_len = apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
+    apply_rules_vect (pw_buf0, pw_buf1, pw_len, rules_buf, il_pos, w0, w1);
  
      u32x w0_t[4];
      u32x w1_t[4];
@@ -513,7 +522,6 @@ __kernel void m08000_s04 (__global pw_t *pws, __global kernel_rule_t *rules_buf,
      u32x w3_t[4];
  
      make_unicode (w0, w0_t, w1_t);
-
      make_unicode (w1, w2_t, w3_t);
  
      u32x w_t[16];