Remove some unroll to reduce register pressure
authorjsteube <jens.steube@gmail.com>
Sun, 8 May 2016 16:29:54 +0000 (18:29 +0200)
committerjsteube <jens.steube@gmail.com>
Sun, 8 May 2016 16:29:54 +0000 (18:29 +0200)
15 files changed:
OpenCL/m01750_a0.cl
OpenCL/m01750_a1.cl
OpenCL/m01750_a3.cl
OpenCL/m01760_a0.cl
OpenCL/m01760_a1.cl
OpenCL/m01760_a3.cl
OpenCL/m01800.cl
OpenCL/m06221.cl
OpenCL/m06222.cl
OpenCL/m06223.cl
OpenCL/m06500.cl
OpenCL/m07100.cl
OpenCL/m08200.cl
OpenCL/m10700.cl
OpenCL/m12300.cl

index 5095385..0ad4790 100644 (file)
@@ -116,12 +116,7 @@ void sha512_transform (const u64x w0[4], const u64x w1[4], const u64x w2[4], con
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index d920d14..f2697fc 100644 (file)
@@ -114,12 +114,7 @@ void sha512_transform (const u64x w0[4], const u64x w1[4], const u64x w2[4], con
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index 2f08963..e213850 100644 (file)
@@ -114,12 +114,7 @@ void sha512_transform (const u64x w0[4], const u64x w1[4], const u64x w2[4], con
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index 8e2338f..f487180 100644 (file)
@@ -116,12 +116,7 @@ void sha512_transform (const u64x w0[4], const u64x w1[4], const u64x w2[4], con
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index a0ba4be..d329446 100644 (file)
@@ -114,12 +114,7 @@ void sha512_transform (const u64x w0[4], const u64x w1[4], const u64x w2[4], con
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index cb8ff6b..b45cfab 100644 (file)
@@ -114,12 +114,7 @@ void sha512_transform (const u64x w0[4], const u64x w1[4], const u64x w2[4], con
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index e0c91f8..d3a821c 100644 (file)
@@ -23,7 +23,8 @@
 // Buggy drivers...
 
 #ifdef IS_AMD
-#define STATE_DECL volatile
+//#define STATE_DECL volatile
+#define STATE_DECL
 #else
 #define STATE_DECL
 #endif
@@ -133,7 +134,7 @@ void sha512_transform (const u64 w[16], u64 digest[8])
 
   ROUND_STEP (0);
 
-  #pragma unroll
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index 60bdf54..2949080 100644 (file)
@@ -115,12 +115,7 @@ void sha512_transform (const u64 w[16], u64 dgst[8])
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index 102a890..2620c72 100644 (file)
@@ -115,12 +115,7 @@ void sha512_transform (const u64 w[16], u64 dgst[8])
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index 86afa82..a0eb7c2 100644 (file)
@@ -115,12 +115,7 @@ void sha512_transform (const u64 w[16], u64 dgst[8])
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index 5fa3977..44e4d7f 100644 (file)
@@ -114,12 +114,7 @@ void sha512_transform (const u64 w0[4], const u64 w1[4], const u64 w2[4], const
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index 15252e7..a9f0900 100644 (file)
@@ -114,12 +114,7 @@ void sha512_transform (const u64 w[16], u64 dgst[8])
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);
index da4405e..73e076d 100644 (file)
@@ -321,12 +321,7 @@ void sha512_transform (const u64 w[16], u64 dgst[8])
 
   ROUND512_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND512_EXPAND (); ROUND512_STEP (i);
index 32ae0e3..c5ec11d 100644 (file)
@@ -242,7 +242,7 @@ void sha384_transform (const u64 w0[4], const u64 w1[4], const u64 w2[4], const
 
   ROUND384_STEP (0);
 
-  #pragma unroll
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND384_EXPAND (); ROUND384_STEP (i);
@@ -352,7 +352,7 @@ void sha512_transform (const u64 w0[4], const u64 w1[4], const u64 w2[4], const
 
   ROUND512_STEP (0);
 
-  #pragma unroll
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND512_EXPAND (); ROUND512_STEP (i);
index 33b410a..5ab6a05 100644 (file)
@@ -114,12 +114,7 @@ void sha512_transform (const u64 w[16], u64 dgst[8])
 
   ROUND_STEP (0);
 
-  #ifdef IS_AMD
-  // #pragma unroll
-  // breaks compiler
-  #else
-  #pragma unroll
-  #endif
+  //#pragma unroll
   for (int i = 16; i < 80; i += 16)
   {
     ROUND_EXPAND (); ROUND_STEP (i);