]> zoso.dev Git - libnemo.git/commitdiff
Inline G mix 1 of round 1.
authorChris Duncan <chris@zoso.dev>
Thu, 9 Jan 2025 15:14:47 +0000 (07:14 -0800)
committerChris Duncan <chris@zoso.dev>
Thu, 9 Jan 2025 15:14:47 +0000 (07:14 -0800)
src/lib/nano-pow/shaders/gpu-compute.ts

index 21415af1ffbac09e7653f3b14dd8e665dec8d91a..6fc4ab2f03c37a6971ed2e6f62bf1e48ce1f9eb3 100644 (file)
@@ -918,7 +918,7 @@ fn main(
        /**
        * r=1, i=0(x2), a=v[0-1], b=v[8-9], c=v[16-17], d=v[24-25]
        */
-       // G(&v0, &v1, &v8, &v9, &v16, &v17, &v24, &v25, 0u, 0u, 0u, 0u);
+
        // a = a + b
        o0 = v0 + v8;
        o1 = v1 + v9;
@@ -1003,84 +1003,88 @@ fn main(
 
 
 
-       G(&v2, &v3, &v10, &v11, &v18, &v19, &v26, &v27, m8, m9, 0u, 0u);
-       // // a = a + b
-       // o0 = v2 + v10;
-       // o1 = v3 + v11;
-       // if (v2 > 0xFFFFFFFFu - v10) {
-       //  o1 = o1 + 1u;
-       // }
-       // v2 = o0;
-       // v3 = o1;
+       /**
+       * r=1, i=1(x2), a=v[2-3], b=v[10-11], c=v[18-19], d=v[26-27]
+       */
 
-       // // a = a + m[sigma[r][2*i+0]]
-       // o0 = v2 + m8;
-       // o1 = v3 + m9;
-       // if (v2 > 0xFFFFFFFFu - m8) {
-       //  o1 = o1 + 1u;
-       // }
-       // v2 = o0;
-       // v3 = o1;
+       // a = a + b
+       o0 = v2 + v10;
+       o1 = v3 + v11;
+       if (v2 > 0xFFFFFFFFu - v10) {
+               o1 = o1 + 1u;
+       }
+       v2 = o0;
+       v3 = o1;
 
-       // // d = rotr64(d ^ a, 32)
-       // xor0 = v26 ^ v2;
-       // xor1 = v27 ^ v3;
-       // v26 = xor1;
-       // v27 = xor0;
+       // a = a + m[sigma[r][2*i+0]]
+       o0 = v2 + m8;
+       o1 = v3 + m9;
+       if (v2 > 0xFFFFFFFFu - m8) {
+               o1 = o1 + 1u;
+       }
+       v2 = o0;
+       v3 = o1;
 
-       // // c = c + d
-       // o0 = v18 + v26;
-       // o1 = v19 + v27;
-       // if (v18 > 0xFFFFFFFFu - v26) {
-       //  o1 = o1 + 1u;
-       // }
-       // v18 = o0;
-       // v19 = o1;
+       // d = rotr64(d ^ a, 32)
+       xor0 = v26 ^ v2;
+       xor1 = v27 ^ v3;
+       v26 = xor1;
+       v27 = xor0;
 
-       // // b = rotr64(b ^ c, 24)
-       // xor0 = v10 ^ v18;
-       // xor1 = v11 ^ v19;
-       // v10 = (xor0 >> 24u) ^ (xor1 << 8u);
-       // v11 = (xor1 >> 24u) ^ (xor0 << 8u);
+       // c = c + d
+       o0 = v18 + v26;
+       o1 = v19 + v27;
+       if (v18 > 0xFFFFFFFFu - v26) {
+               o1 = o1 + 1u;
+       }
+       v18 = o0;
+       v19 = o1;
 
-       // // a = a + b
-       // o0 = v2 + v10;
-       // o1 = v3 + v11;
-       // if (v2 > 0xFFFFFFFFu - v10) {
-       //  o1 = o1 + 1u;
-       // }
-       // v2 = o0;
-       // v3 = o1;
+       // b = rotr64(b ^ c, 24)
+       xor0 = v10 ^ v18;
+       xor1 = v11 ^ v19;
+       v10 = (xor0 >> 24u) ^ (xor1 << 8u);
+       v11 = (xor1 >> 24u) ^ (xor0 << 8u);
+
+       // a = a + b
+       o0 = v2 + v10;
+       o1 = v3 + v11;
+       if (v2 > 0xFFFFFFFFu - v10) {
+               o1 = o1 + 1u;
+       }
+       v2 = o0;
+       v3 = o1;
 
        // // a = a + m[sigma[r][2*i+1]]
+       // // skip since adding 0u does nothing
        // o0 = v2 + 0u;
        // o1 = v3 + 0u;
        // if (v2 > 0xFFFFFFFFu - 0u) {
-       //  o1 = o1 + 1u;
+       //      o1 = o1 + 1u;
        // }
        // v2 = o0;
        // v3 = o1;
 
-       // // d = rotr64(d ^ a, 16)
-       // xor0 = v26 ^ v2;
-       // xor1 = v27 ^ v3;
-       // v26 = (xor0 >> 16u) ^ (xor1 << 16u);
-       // v27 = (xor1 >> 16u) ^ (xor0 << 16u);
+       // d = rotr64(d ^ a, 16)
+       xor0 = v26 ^ v2;
+       xor1 = v27 ^ v3;
+       v26 = (xor0 >> 16u) ^ (xor1 << 16u);
+       v27 = (xor1 >> 16u) ^ (xor0 << 16u);
 
-       // // c = c + d
-       // o0 = v18 + v26;
-       // o1 = v19 + v27;
-       // if (v18 > 0xFFFFFFFFu - v26) {
-       //  o1 = o1 + 1u;
-       // }
-       // v18 = o0;
-       // v19 = o1;
+       // c = c + d
+       o0 = v18 + v26;
+       o1 = v19 + v27;
+       if (v18 > 0xFFFFFFFFu - v26) {
+               o1 = o1 + 1u;
+       }
+       v18 = o0;
+       v19 = o1;
 
-       // // b = rotr64(b ^ c, 63)
-       // xor0 = v10 ^ v18;
-       // xor1 = v11 ^ v19;
-       // v10 = (xor1 >> 31u) ^ (xor0 << 1u);
-       // v11 = (xor0 >> 31u) ^ (xor1 << 1u);
+       // b = rotr64(b ^ c, 63)
+       xor0 = v10 ^ v18;
+       xor1 = v11 ^ v19;
+       v10 = (xor1 >> 31u) ^ (xor0 << 1u);
+       v11 = (xor0 >> 31u) ^ (xor1 << 1u);