From: Chris Duncan Date: Thu, 9 Jan 2025 17:32:12 +0000 (-0800) Subject: Inline G mix 5 of round 1. X-Git-Url: https://zoso.dev/?a=commitdiff_plain;h=cc854c6b058d97973fc2eed16706733e144cb270;p=libnemo.git Inline G mix 5 of round 1. --- diff --git a/src/lib/nano-pow/shaders/gpu-compute.ts b/src/lib/nano-pow/shaders/gpu-compute.ts index af4bfa2..e2d8b3c 100644 --- a/src/lib/nano-pow/shaders/gpu-compute.ts +++ b/src/lib/nano-pow/shaders/gpu-compute.ts @@ -1345,84 +1345,87 @@ fn main( - G(&v2, &v3, &v12, &v13, &v22, &v23, &v24, &v25, m0, m1, m4, m5); - // // a = a + b - // o0 = v2 + v12; - // o1 = v3 + v13; - // if (v2 > 0xFFFFFFFFu - v12) { - // o1 = o1 + 1u; - // } - // v2 = o0; - // v3 = o1; + /** + * r=1, i=5(x2), a=v[2-3], b=v[12-13], c=v[22-23], d=v[24-25] + */ - // // a = a + m[sigma[r][2*i+0]] - // o0 = v2 + m0; - // o1 = v3 + m1; - // if (v2 > 0xFFFFFFFFu - m0) { - // o1 = o1 + 1u; - // } - // v2 = o0; - // v3 = o1; + // a = a + b + o0 = v2 + v12; + o1 = v3 + v13; + if (v2 > 0xFFFFFFFFu - v12) { + o1 = o1 + 1u; + } + v2 = o0; + v3 = o1; - // // d = rotr64(d ^ a, 32) - // xor0 = v24 ^ v2; - // xor1 = v25 ^ v3; - // v24 = xor1; - // v25 = xor0; + // a = a + m[sigma[r][2*i+0]] + o0 = v2 + m0; + o1 = v3 + m1; + if (v2 > 0xFFFFFFFFu - m0) { + o1 = o1 + 1u; + } + v2 = o0; + v3 = o1; - // // c = c + d - // o0 = v22 + v24; - // o1 = v23 + v25; - // if (v22 > 0xFFFFFFFFu - v24) { - // o1 = o1 + 1u; - // } - // v22 = o0; - // v23 = o1; + // d = rotr64(d ^ a, 32) + xor0 = v24 ^ v2; + xor1 = v25 ^ v3; + v24 = xor1; + v25 = xor0; - // // b = rotr64(b ^ c, 24) - // xor0 = v12 ^ v22; - // xor1 = v13 ^ v23; - // v12 = (xor0 >> 24u) ^ (xor1 << 8u); - // v13 = (xor1 >> 24u) ^ (xor0 << 8u); + // c = c + d + o0 = v22 + v24; + o1 = v23 + v25; + if (v22 > 0xFFFFFFFFu - v24) { + o1 = o1 + 1u; + } + v22 = o0; + v23 = o1; - // // a = a + b - // o0 = v2 + v12; - // o1 = v3 + v13; - // if (v2 > 0xFFFFFFFFu - v12) { - // o1 = o1 + 1u; - // } - // v2 = o0; - // v3 = o1; + // b = rotr64(b ^ c, 24) + xor0 = v12 ^ v22; + xor1 = v13 ^ v23; + v12 = (xor0 >> 24u) ^ (xor1 << 8u); + v13 = (xor1 >> 24u) ^ (xor0 << 8u); - // // a = a + m[sigma[r][2*i+1]] - // o0 = v2 + m4; - // o1 = v3 + m5; - // if (v2 > 0xFFFFFFFFu - m4) { - // o1 = o1 + 1u; - // } - // v2 = o0; - // v3 = o1; + // a = a + b + o0 = v2 + v12; + o1 = v3 + v13; + if (v2 > 0xFFFFFFFFu - v12) { + o1 = o1 + 1u; + } + v2 = o0; + v3 = o1; - // // d = rotr64(d ^ a, 16) - // xor0 = v24 ^ v2; - // xor1 = v25 ^ v3; - // v24 = (xor0 >> 16u) ^ (xor1 << 16u); - // v25 = (xor1 >> 16u) ^ (xor0 << 16u); + // a = a + m[sigma[r][2*i+1]] + o0 = v2 + m4; + o1 = v3 + m5; + if (v2 > 0xFFFFFFFFu - m4) { + o1 = o1 + 1u; + } + v2 = o0; + v3 = o1; - // // c = c + d - // o0 = v22 + v24; - // o1 = v23 + v25; - // if (v22 > 0xFFFFFFFFu - v24) { - // o1 = o1 + 1u; - // } - // v22 = o0; - // v23 = o1; + // d = rotr64(d ^ a, 16) + xor0 = v24 ^ v2; + xor1 = v25 ^ v3; + v24 = (xor0 >> 16u) ^ (xor1 << 16u); + v25 = (xor1 >> 16u) ^ (xor0 << 16u); - // // b = rotr64(b ^ c, 63) - // xor0 = v12 ^ v22; - // xor1 = v13 ^ v23; - // v12 = (xor1 >> 31u) ^ (xor0 << 1u); - // v13 = (xor0 >> 31u) ^ (xor1 << 1u); + // c = c + d + o0 = v22 + v24; + o1 = v23 + v25; + if (v22 > 0xFFFFFFFFu - v24) { + o1 = o1 + 1u; + } + v22 = o0; + v23 = o1; + + // b = rotr64(b ^ c, 63) + xor0 = v12 ^ v22; + xor1 = v13 ^ v23; + v12 = (xor1 >> 31u) ^ (xor0 << 1u); + v13 = (xor0 >> 31u) ^ (xor1 << 1u);