From: Chris Duncan Date: Wed, 8 Jan 2025 22:10:13 +0000 (-0800) Subject: Inline G mix 7 of round 0. X-Git-Url: https://zoso.dev/?a=commitdiff_plain;h=0d7889b5426cbefe6375d1308fbdb79c41378d0c;p=libnemo.git Inline G mix 7 of round 0. --- diff --git a/src/lib/nano-pow/shaders/gpu-compute.ts b/src/lib/nano-pow/shaders/gpu-compute.ts index 012ef93..f15ad49 100644 --- a/src/lib/nano-pow/shaders/gpu-compute.ts +++ b/src/lib/nano-pow/shaders/gpu-compute.ts @@ -817,7 +817,93 @@ fn main( - G(&v6, &v7, &v8, &v9, &v18, &v19, &v28, &v29, 0u, 0u, 0u, 0u); + + + /** + * r=0, i=7(x2), a=v[6-7], b=v[8-9], c=v[18-19], d=v[28-29] + */ + + // a = a + b + o0 = v6 + v8; + o1 = v7 + v9; + if (v6 > 0xFFFFFFFFu - v8) { + o1 = o1 + 1u; + } + v6 = o0; + v7 = o1; + + // // a = a + m[sigma[r][2*i+0]] + // // skip since adding 0u does nothing + // o0 = v6 + 0u; + // o1 = v7 + 0u; + // if (v6 > 0xFFFFFFFFu - 0u) { + // o1 = o1 + 1u; + // } + // v6 = o0; + // v7 = o1; + + // d = rotr64(d ^ a, 32) + xor0 = v28 ^ v6; + xor1 = v29 ^ v7; + v28 = xor1; + v29 = xor0; + + // c = c + d + o0 = v18 + v28; + o1 = v19 + v29; + if (v18 > 0xFFFFFFFFu - v28) { + o1 = o1 + 1u; + } + v18 = o0; + v19 = o1; + + // b = rotr64(b ^ c, 24) + xor0 = v8 ^ v18; + xor1 = v9 ^ v19; + v8 = (xor0 >> 24u) ^ (xor1 << 8u); + v9 = (xor1 >> 24u) ^ (xor0 << 8u); + + // a = a + b + o0 = v6 + v8; + o1 = v7 + v9; + if (v6 > 0xFFFFFFFFu - v8) { + o1 = o1 + 1u; + } + v6 = o0; + v7 = o1; + + // // a = a + m[sigma[r][2*i+1]] + // // skip since adding 0u does nothing + // o0 = v6 + 0u; + // o1 = v7 + 0u; + // if (v6 > 0xFFFFFFFFu - 0u) { + // o1 = o1 + 1u; + // } + // v6 = o0; + // v7 = o1; + + // d = rotr64(d ^ a, 16) + xor0 = v28 ^ v6; + xor1 = v29 ^ v7; + v28 = (xor0 >> 16u) ^ (xor1 << 16u); + v29 = (xor1 >> 16u) ^ (xor0 << 16u); + + // c = c + d + o0 = v18 + v28; + o1 = v19 + v29; + if (v18 > 0xFFFFFFFFu - v28) { + o1 = o1 + 1u; + } + v18 = o0; + v19 = o1; + + // b = rotr64(b ^ c, 63) + xor0 = v8 ^ v18; + xor1 = v9 ^ v19; + v8 = (xor1 >> 31u) ^ (xor0 << 1u); + v9 = (xor0 >> 31u) ^ (xor1 << 1u); + +