From: Chris Duncan Date: Thu, 9 Jan 2025 15:14:47 +0000 (-0800) Subject: Inline G mix 1 of round 1. X-Git-Url: https://zoso.dev/?a=commitdiff_plain;h=5b5dfcb3b2b984eb0e08c767cc9190bd5c7bb2b2;p=libnemo.git Inline G mix 1 of round 1. --- diff --git a/src/lib/nano-pow/shaders/gpu-compute.ts b/src/lib/nano-pow/shaders/gpu-compute.ts index 21415af..6fc4ab2 100644 --- a/src/lib/nano-pow/shaders/gpu-compute.ts +++ b/src/lib/nano-pow/shaders/gpu-compute.ts @@ -918,7 +918,7 @@ fn main( /** * r=1, i=0(x2), a=v[0-1], b=v[8-9], c=v[16-17], d=v[24-25] */ - // G(&v0, &v1, &v8, &v9, &v16, &v17, &v24, &v25, 0u, 0u, 0u, 0u); + // a = a + b o0 = v0 + v8; o1 = v1 + v9; @@ -1003,84 +1003,88 @@ fn main( - G(&v2, &v3, &v10, &v11, &v18, &v19, &v26, &v27, m8, m9, 0u, 0u); - // // a = a + b - // o0 = v2 + v10; - // o1 = v3 + v11; - // if (v2 > 0xFFFFFFFFu - v10) { - // o1 = o1 + 1u; - // } - // v2 = o0; - // v3 = o1; + /** + * r=1, i=1(x2), a=v[2-3], b=v[10-11], c=v[18-19], d=v[26-27] + */ - // // a = a + m[sigma[r][2*i+0]] - // o0 = v2 + m8; - // o1 = v3 + m9; - // if (v2 > 0xFFFFFFFFu - m8) { - // o1 = o1 + 1u; - // } - // v2 = o0; - // v3 = o1; + // a = a + b + o0 = v2 + v10; + o1 = v3 + v11; + if (v2 > 0xFFFFFFFFu - v10) { + o1 = o1 + 1u; + } + v2 = o0; + v3 = o1; - // // d = rotr64(d ^ a, 32) - // xor0 = v26 ^ v2; - // xor1 = v27 ^ v3; - // v26 = xor1; - // v27 = xor0; + // a = a + m[sigma[r][2*i+0]] + o0 = v2 + m8; + o1 = v3 + m9; + if (v2 > 0xFFFFFFFFu - m8) { + o1 = o1 + 1u; + } + v2 = o0; + v3 = o1; - // // c = c + d - // o0 = v18 + v26; - // o1 = v19 + v27; - // if (v18 > 0xFFFFFFFFu - v26) { - // o1 = o1 + 1u; - // } - // v18 = o0; - // v19 = o1; + // d = rotr64(d ^ a, 32) + xor0 = v26 ^ v2; + xor1 = v27 ^ v3; + v26 = xor1; + v27 = xor0; - // // b = rotr64(b ^ c, 24) - // xor0 = v10 ^ v18; - // xor1 = v11 ^ v19; - // v10 = (xor0 >> 24u) ^ (xor1 << 8u); - // v11 = (xor1 >> 24u) ^ (xor0 << 8u); + // c = c + d + o0 = v18 + v26; + o1 = v19 + v27; + if (v18 > 0xFFFFFFFFu - v26) { + o1 = o1 + 1u; + } + v18 = o0; + v19 = o1; - // // a = a + b - // o0 = v2 + v10; - // o1 = v3 + v11; - // if (v2 > 0xFFFFFFFFu - v10) { - // o1 = o1 + 1u; - // } - // v2 = o0; - // v3 = o1; + // b = rotr64(b ^ c, 24) + xor0 = v10 ^ v18; + xor1 = v11 ^ v19; + v10 = (xor0 >> 24u) ^ (xor1 << 8u); + v11 = (xor1 >> 24u) ^ (xor0 << 8u); + + // a = a + b + o0 = v2 + v10; + o1 = v3 + v11; + if (v2 > 0xFFFFFFFFu - v10) { + o1 = o1 + 1u; + } + v2 = o0; + v3 = o1; // // a = a + m[sigma[r][2*i+1]] + // // skip since adding 0u does nothing // o0 = v2 + 0u; // o1 = v3 + 0u; // if (v2 > 0xFFFFFFFFu - 0u) { - // o1 = o1 + 1u; + // o1 = o1 + 1u; // } // v2 = o0; // v3 = o1; - // // d = rotr64(d ^ a, 16) - // xor0 = v26 ^ v2; - // xor1 = v27 ^ v3; - // v26 = (xor0 >> 16u) ^ (xor1 << 16u); - // v27 = (xor1 >> 16u) ^ (xor0 << 16u); + // d = rotr64(d ^ a, 16) + xor0 = v26 ^ v2; + xor1 = v27 ^ v3; + v26 = (xor0 >> 16u) ^ (xor1 << 16u); + v27 = (xor1 >> 16u) ^ (xor0 << 16u); - // // c = c + d - // o0 = v18 + v26; - // o1 = v19 + v27; - // if (v18 > 0xFFFFFFFFu - v26) { - // o1 = o1 + 1u; - // } - // v18 = o0; - // v19 = o1; + // c = c + d + o0 = v18 + v26; + o1 = v19 + v27; + if (v18 > 0xFFFFFFFFu - v26) { + o1 = o1 + 1u; + } + v18 = o0; + v19 = o1; - // // b = rotr64(b ^ c, 63) - // xor0 = v10 ^ v18; - // xor1 = v11 ^ v19; - // v10 = (xor1 >> 31u) ^ (xor0 << 1u); - // v11 = (xor0 >> 31u) ^ (xor1 << 1u); + // b = rotr64(b ^ c, 63) + xor0 = v10 ^ v18; + xor1 = v11 ^ v19; + v10 = (xor1 >> 31u) ^ (xor0 << 1u); + v11 = (xor0 >> 31u) ^ (xor1 << 1u);