Fix speed -m 9700, 9710, 9800 and 9810 for NV, also increases some on AMD
authorjsteube <jens.steube@gmail.com>
Wed, 30 Dec 2015 20:30:29 +0000 (21:30 +0100)
committerjsteube <jens.steube@gmail.com>
Wed, 30 Dec 2015 20:30:29 +0000 (21:30 +0100)
12 files changed:
OpenCL/m09700_a0.cl
OpenCL/m09700_a1.cl
OpenCL/m09700_a3.cl
OpenCL/m09710_a0.cl
OpenCL/m09710_a1.cl
OpenCL/m09710_a3.cl
OpenCL/m09800_a0.cl
OpenCL/m09800_a1.cl
OpenCL/m09800_a3.cl
OpenCL/m09810_a0.cl
OpenCL/m09810_a1.cl
OpenCL/m09810_a3.cl

index ce1ad14..22ef2a4 100644 (file)
@@ -54,7 +54,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index e13710e..3bfdcf5 100644 (file)
@@ -52,7 +52,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index c410c46..10b2a48 100644 (file)
@@ -52,7 +52,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index b6aa2cb..5febbbe 100644 (file)
@@ -54,7 +54,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index b3d9ffe..97f8897 100644 (file)
@@ -52,7 +52,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index 43eda72..e07607d 100644 (file)
@@ -52,7 +52,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index 33331bc..a66815a 100644 (file)
@@ -54,7 +54,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index 91e9e62..96a3b06 100644 (file)
@@ -52,7 +52,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index ee088eb..67790a1 100644 (file)
@@ -52,7 +52,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index c03ee81..67fc6f3 100644 (file)
@@ -54,7 +54,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index 14e1e34..f09f743 100644 (file)
@@ -52,7 +52,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;
index af4886e..6efc225 100644 (file)
@@ -52,7 +52,6 @@ static void rc4_init_16 (__local RC4_KEY *rc4_key, const u32 data[4])
 
   u32 j = 0;
 
-  #pragma unroll
   for (u32 i = 0; i < 16; i++)
   {
     u32 idx = i * 16;