Replace some 63-bit scalar rotations with vector rotations.

author Chris Duncan <chris@zoso.dev>

Tue, 14 Jan 2025 19:52:50 +0000 (11:52 -0800)

committer Chris Duncan <chris@zoso.dev>

Tue, 14 Jan 2025 19:52:50 +0000 (11:52 -0800)
author Chris Duncan <chris@zoso.dev>
Tue, 14 Jan 2025 19:52:50 +0000 (11:52 -0800)
committer Chris Duncan <chris@zoso.dev>
Tue, 14 Jan 2025 19:52:50 +0000 (11:52 -0800)
diff --git a/src/shaders/compute.wgsl b/src/shaders/compute.wgsl

index 5cff052b5acd59a9355e1c1edee41d9322cb3a25..90d406261145a224b767758a1b60d951b8415916 100644 (file)
--- a/src/shaders/compute.wgsl
+++ b/src/shaders/compute.wgsl
@@ -213,10 +213,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -1026,10 +1030,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -1842,10 +1850,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -2649,10 +2661,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -3471,10 +3487,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -4296,10 +4316,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -5115,10 +5139,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -5931,10 +5959,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -6747,10 +6779,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -7569,10 +7605,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -8391,10 +8431,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
  
  
  
@@ -9204,10 +9248,14 @@ fn main(@builtin(global_invocation_id) id: vec3<u32>) {
         v25 = v_2425.y;
  
         // b = rotr64(b ^ c, 63)
-       xor0 = v8 ^ v16;
-       xor1 = v9 ^ v17;
-       v8 = (xor1 >> 31u) ^ (xor0 << 1u);
-       v9 = (xor0 >> 31u) ^ (xor1 << 1u);
+       v_1617.x = v16;
+       v_1617.y = v17;
+       v_89.x = v8;
+       v_89.y = v9;
+       xor = v_89 ^ v_1617;
+       v_89 = vec2((xor.x << 1u) | (xor.y >> 31u), (xor.y << 1u) | (xor.x >> 31u));
+       v8 = v_89.x;
+       v9 = v_89.y;
author	Chris Duncan <chris@zoso.dev>
	Tue, 14 Jan 2025 19:52:50 +0000 (11:52 -0800)
committer	Chris Duncan <chris@zoso.dev>
	Tue, 14 Jan 2025 19:52:50 +0000 (11:52 -0800)