From: Chris Duncan <chris@zoso.dev>
Date: Thu, 9 Jan 2025 17:29:09 +0000 (-0800)
Subject: Inline G mix 4 of round 1.
X-Git-Url: https://zoso.dev/?a=commitdiff_plain;h=588842dbeb03fda731db6fdb851197e20fee9aad;p=libnemo.git

Inline G mix 4 of round 1.
---

diff --git a/src/lib/nano-pow/shaders/gpu-compute.ts b/src/lib/nano-pow/shaders/gpu-compute.ts
index 8ea072b..af4bfa2 100644
--- a/src/lib/nano-pow/shaders/gpu-compute.ts
+++ b/src/lib/nano-pow/shaders/gpu-compute.ts
@@ -1258,84 +1258,88 @@ fn main(
 
 
 
-		G(&v0, &v1, &v10, &v11, &v20, &v21, &v30, &v31, m2, m3, 0u, 0u);
-	// // a = a + b
-	// o0 = v0 + v10;
-	// o1 = v1 + v11;
-	// if (v0 > 0xFFFFFFFFu - v10) {
-	//  o1 = o1 + 1u;
-	// }
-	// v0 = o0;
-	// v1 = o1;
+	/**
+	* r=1, i=4(x2), a=v[0-1], b=v[11-12], c=v[21-22], d=v[30-31]
+	*/
 
-	// // a = a + m[sigma[r][2*i+0]]
-	// o0 = v0 + m2;
-	// o1 = v1 + m3;
-	// if (v0 > 0xFFFFFFFFu - m2) {
-	//  o1 = o1 + 1u;
-	// }
-	// v0 = o0;
-	// v1 = o1;
+	// a = a + b
+	o0 = v0 + v10;
+	o1 = v1 + v11;
+	if (v0 > 0xFFFFFFFFu - v10) {
+		o1 = o1 + 1u;
+	}
+	v0 = o0;
+	v1 = o1;
 
-	// // d = rotr64(d ^ a, 32)
-	// xor0 = v30 ^ v0;
-	// xor1 = v31 ^ v1;
-	// v30 = xor1;
-	// v31 = xor0;
+	// a = a + m[sigma[r][2*i+0]]
+	o0 = v0 + m2;
+	o1 = v1 + m3;
+	if (v0 > 0xFFFFFFFFu - m2) {
+		o1 = o1 + 1u;
+	}
+	v0 = o0;
+	v1 = o1;
 
-	// // c = c + d
-	// o0 = v20 + v30;
-	// o1 = v21 + v31;
-	// if (v20 > 0xFFFFFFFFu - v30) {
-	//  o1 = o1 + 1u;
-	// }
-	// v20 = o0;
-	// v21 = o1;
+	// d = rotr64(d ^ a, 32)
+	xor0 = v30 ^ v0;
+	xor1 = v31 ^ v1;
+	v30 = xor1;
+	v31 = xor0;
 
-	// // b = rotr64(b ^ c, 24)
-	// xor0 = v10 ^ v20;
-	// xor1 = v11 ^ v21;
-	// v10 = (xor0 >> 24u) ^ (xor1 << 8u);
-	// v11 = (xor1 >> 24u) ^ (xor0 << 8u);
+	// c = c + d
+	o0 = v20 + v30;
+	o1 = v21 + v31;
+	if (v20 > 0xFFFFFFFFu - v30) {
+		o1 = o1 + 1u;
+	}
+	v20 = o0;
+	v21 = o1;
 
-	// // a = a + b
-	// o0 = v0 + v10;
-	// o1 = v1 + v11;
-	// if (v0 > 0xFFFFFFFFu - v10) {
-	//  o1 = o1 + 1u;
-	// }
-	// v0 = o0;
-	// v1 = o1;
+	// b = rotr64(b ^ c, 24)
+	xor0 = v10 ^ v20;
+	xor1 = v11 ^ v21;
+	v10 = (xor0 >> 24u) ^ (xor1 << 8u);
+	v11 = (xor1 >> 24u) ^ (xor0 << 8u);
+
+	// a = a + b
+	o0 = v0 + v10;
+	o1 = v1 + v11;
+	if (v0 > 0xFFFFFFFFu - v10) {
+		o1 = o1 + 1u;
+	}
+	v0 = o0;
+	v1 = o1;
 
 	// // a = a + m[sigma[r][2*i+1]]
+	// // skip since adding 0u does nothing
 	// o0 = v0 + 0u;
 	// o1 = v1 + 0u;
 	// if (v0 > 0xFFFFFFFFu - 0u) {
-	//  o1 = o1 + 1u;
+	// 	o1 = o1 + 1u;
 	// }
 	// v0 = o0;
 	// v1 = o1;
 
-	// // d = rotr64(d ^ a, 16)
-	// xor0 = v30 ^ v0;
-	// xor1 = v31 ^ v1;
-	// v30 = (xor0 >> 16u) ^ (xor1 << 16u);
-	// v31 = (xor1 >> 16u) ^ (xor0 << 16u);
+	// d = rotr64(d ^ a, 16)
+	xor0 = v30 ^ v0;
+	xor1 = v31 ^ v1;
+	v30 = (xor0 >> 16u) ^ (xor1 << 16u);
+	v31 = (xor1 >> 16u) ^ (xor0 << 16u);
 
-	// // c = c + d
-	// o0 = v20 + v30;
-	// o1 = v21 + v31;
-	// if (v20 > 0xFFFFFFFFu - v30) {
-	//  o1 = o1 + 1u;
-	// }
-	// v20 = o0;
-	// v21 = o1;
+	// c = c + d
+	o0 = v20 + v30;
+	o1 = v21 + v31;
+	if (v20 > 0xFFFFFFFFu - v30) {
+		o1 = o1 + 1u;
+	}
+	v20 = o0;
+	v21 = o1;
 
-	// // b = rotr64(b ^ c, 63)
-	// xor0 = v10 ^ v20;
-	// xor1 = v11 ^ v21;
-	// v10 = (xor1 >> 31u) ^ (xor0 << 1u);
-	// v11 = (xor0 >> 31u) ^ (xor1 << 1u);
+	// b = rotr64(b ^ c, 63)
+	xor0 = v10 ^ v20;
+	xor1 = v11 ^ v21;
+	v10 = (xor1 >> 31u) ^ (xor0 << 1u);
+	v11 = (xor0 >> 31u) ^ (xor1 << 1u);