]> zoso.dev Git - libnemo.git/commitdiff
Inline G mix 5 of round 1.
authorChris Duncan <chris@zoso.dev>
Thu, 9 Jan 2025 17:32:12 +0000 (09:32 -0800)
committerChris Duncan <chris@zoso.dev>
Thu, 9 Jan 2025 17:32:12 +0000 (09:32 -0800)
src/lib/nano-pow/shaders/gpu-compute.ts

index af4bfa265d58afdc6b69ef4b2355572bbf69c12a..e2d8b3c008f1fa8047e7e92e8878e1f5196bbd48 100644 (file)
@@ -1345,84 +1345,87 @@ fn main(
 
 
 
-               G(&v2, &v3, &v12, &v13, &v22, &v23, &v24, &v25, m0, m1, m4, m5);
-       // // a = a + b
-       // o0 = v2 + v12;
-       // o1 = v3 + v13;
-       // if (v2 > 0xFFFFFFFFu - v12) {
-       //  o1 = o1 + 1u;
-       // }
-       // v2 = o0;
-       // v3 = o1;
+       /**
+       * r=1, i=5(x2), a=v[2-3], b=v[12-13], c=v[22-23], d=v[24-25]
+       */
 
-       // // a = a + m[sigma[r][2*i+0]]
-       // o0 = v2 + m0;
-       // o1 = v3 + m1;
-       // if (v2 > 0xFFFFFFFFu - m0) {
-       //  o1 = o1 + 1u;
-       // }
-       // v2 = o0;
-       // v3 = o1;
+       // a = a + b
+       o0 = v2 + v12;
+       o1 = v3 + v13;
+       if (v2 > 0xFFFFFFFFu - v12) {
+               o1 = o1 + 1u;
+       }
+       v2 = o0;
+       v3 = o1;
 
-       // // d = rotr64(d ^ a, 32)
-       // xor0 = v24 ^ v2;
-       // xor1 = v25 ^ v3;
-       // v24 = xor1;
-       // v25 = xor0;
+       // a = a + m[sigma[r][2*i+0]]
+       o0 = v2 + m0;
+       o1 = v3 + m1;
+       if (v2 > 0xFFFFFFFFu - m0) {
+               o1 = o1 + 1u;
+       }
+       v2 = o0;
+       v3 = o1;
 
-       // // c = c + d
-       // o0 = v22 + v24;
-       // o1 = v23 + v25;
-       // if (v22 > 0xFFFFFFFFu - v24) {
-       //  o1 = o1 + 1u;
-       // }
-       // v22 = o0;
-       // v23 = o1;
+       // d = rotr64(d ^ a, 32)
+       xor0 = v24 ^ v2;
+       xor1 = v25 ^ v3;
+       v24 = xor1;
+       v25 = xor0;
 
-       // // b = rotr64(b ^ c, 24)
-       // xor0 = v12 ^ v22;
-       // xor1 = v13 ^ v23;
-       // v12 = (xor0 >> 24u) ^ (xor1 << 8u);
-       // v13 = (xor1 >> 24u) ^ (xor0 << 8u);
+       // c = c + d
+       o0 = v22 + v24;
+       o1 = v23 + v25;
+       if (v22 > 0xFFFFFFFFu - v24) {
+               o1 = o1 + 1u;
+       }
+       v22 = o0;
+       v23 = o1;
 
-       // // a = a + b
-       // o0 = v2 + v12;
-       // o1 = v3 + v13;
-       // if (v2 > 0xFFFFFFFFu - v12) {
-       //  o1 = o1 + 1u;
-       // }
-       // v2 = o0;
-       // v3 = o1;
+       // b = rotr64(b ^ c, 24)
+       xor0 = v12 ^ v22;
+       xor1 = v13 ^ v23;
+       v12 = (xor0 >> 24u) ^ (xor1 << 8u);
+       v13 = (xor1 >> 24u) ^ (xor0 << 8u);
 
-       // // a = a + m[sigma[r][2*i+1]]
-       // o0 = v2 + m4;
-       // o1 = v3 + m5;
-       // if (v2 > 0xFFFFFFFFu - m4) {
-       //  o1 = o1 + 1u;
-       // }
-       // v2 = o0;
-       // v3 = o1;
+       // a = a + b
+       o0 = v2 + v12;
+       o1 = v3 + v13;
+       if (v2 > 0xFFFFFFFFu - v12) {
+               o1 = o1 + 1u;
+       }
+       v2 = o0;
+       v3 = o1;
 
-       // // d = rotr64(d ^ a, 16)
-       // xor0 = v24 ^ v2;
-       // xor1 = v25 ^ v3;
-       // v24 = (xor0 >> 16u) ^ (xor1 << 16u);
-       // v25 = (xor1 >> 16u) ^ (xor0 << 16u);
+       // a = a + m[sigma[r][2*i+1]]
+       o0 = v2 + m4;
+       o1 = v3 + m5;
+       if (v2 > 0xFFFFFFFFu - m4) {
+               o1 = o1 + 1u;
+       }
+       v2 = o0;
+       v3 = o1;
 
-       // // c = c + d
-       // o0 = v22 + v24;
-       // o1 = v23 + v25;
-       // if (v22 > 0xFFFFFFFFu - v24) {
-       //  o1 = o1 + 1u;
-       // }
-       // v22 = o0;
-       // v23 = o1;
+       // d = rotr64(d ^ a, 16)
+       xor0 = v24 ^ v2;
+       xor1 = v25 ^ v3;
+       v24 = (xor0 >> 16u) ^ (xor1 << 16u);
+       v25 = (xor1 >> 16u) ^ (xor0 << 16u);
 
-       // // b = rotr64(b ^ c, 63)
-       // xor0 = v12 ^ v22;
-       // xor1 = v13 ^ v23;
-       // v12 = (xor1 >> 31u) ^ (xor0 << 1u);
-       // v13 = (xor0 >> 31u) ^ (xor1 << 1u);
+       // c = c + d
+       o0 = v22 + v24;
+       o1 = v23 + v25;
+       if (v22 > 0xFFFFFFFFu - v24) {
+               o1 = o1 + 1u;
+       }
+       v22 = o0;
+       v23 = o1;
+
+       // b = rotr64(b ^ c, 63)
+       xor0 = v12 ^ v22;
+       xor1 = v13 ^ v23;
+       v12 = (xor1 >> 31u) ^ (xor0 << 1u);
+       v13 = (xor0 >> 31u) ^ (xor1 << 1u);