From: Chris Duncan Date: Tue, 4 Feb 2025 00:35:59 +0000 (-0800) Subject: Update comments. X-Git-Tag: v3.0.0~45 X-Git-Url: https://zoso.dev/?a=commitdiff_plain;h=7c2b8b6c1f66683c8ea416126ca7526d653e84c7;p=nano-pow.git Update comments. --- diff --git a/src/shaders/compute.wgsl b/src/shaders/compute.wgsl index 5969c24..d11c7ab 100644 --- a/src/shaders/compute.wgsl +++ b/src/shaders/compute.wgsl @@ -425,16 +425,13 @@ fn main(id: vec3) { * r=3, i=2, a=v[2], b=v[6], c=v[10], d=v[14], m[sigma]=?, m[sigma+1]=? * r=3, i=3, a=v[3], b=v[7], c=v[11], d=v[15], m[sigma]=?, m[sigma+1]=? */ - // x = VEC4_0; - // y = VEC4_0; - v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); - // v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); + // NOP vEF = (vEF ^ v23).yxwz; vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) >> ROTATE_24) | ((v67 ^ vAB).yxwz << ROTATE_8); v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); - // v23 += y + vec4(0u, u32(v23.x + y.x < v23.x), 0u, u32(v23.z + y.z < v23.z)); + // NOP vEF = ((vEF ^ v23) >> ROTATE_16) | ((vEF ^ v23).yxwz << ROTATE_16); vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) << ROTATE_1) | ((v67 ^ vAB).yxwz >> ROTATE_31); @@ -446,7 +443,6 @@ fn main(id: vec3) { b = vec4(v45.zw, v67.xy); d = vec4(vEF.zw, vCD.xy); x = vec4(m2, VEC2_0); - // y = VEC4_0; v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); @@ -454,7 +450,7 @@ fn main(id: vec3) { vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) >> ROTATE_24) | ((b ^ vAB).yxwz << ROTATE_8); v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); - // v01 += y + vec4(0u, u32(v01.x + y.x < v01.x), 0u, u32(v01.z + y.z < v01.z)); + // NOP d = ((d ^ v01) >> ROTATE_16) | ((d ^ v01).yxwz << ROTATE_16); vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) << ROTATE_1) | ((b ^ vAB).yxwz >> ROTATE_31); @@ -501,11 +497,10 @@ fn main(id: vec3) { * r=4, i=0, a=v[0], b=v[4], c=v[8], d=v[12], m[sigma]=?, m[sigma+1]=? * r=4, i=1, a=v[1], b=v[5], c=v[9], d=v[13], m[sigma]=?, m[sigma+1]=? */ - // x = VEC4_0; // y = vec4(m0, VEC2_0); // still assigned this value from last assignment at r=3 i=6/7 v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); - // v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); + // NOP vCD = (vCD ^ v01).yxwz; v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) >> ROTATE_24) | ((v45 ^ v89).yxwz << ROTATE_8); @@ -539,11 +534,10 @@ fn main(id: vec3) { */ b = vec4(v45.zw, v67.xy); d = vec4(vEF.zw, vCD.xy); - // x = VEC4_0; y = vec4(m1, VEC2_0); v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); - // v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); + // NOP d = (d ^ v01).yxwz; vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) >> ROTATE_24) | ((b ^ vAB).yxwz << ROTATE_8); @@ -565,7 +559,6 @@ fn main(id: vec3) { b = vec4(v67.zw, v45.xy); d = vec4(vCD.zw, vEF.xy); x = vec4(VEC2_0, m3); - // y = VEC4_0; v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); @@ -573,7 +566,7 @@ fn main(id: vec3) { v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) >> ROTATE_24) | ((b ^ v89).yxwz << ROTATE_8); v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); - // v23 += y + vec4(0u, u32(v23.x + y.x < v23.x), 0u, u32(v23.z + y.z < v23.z)); + // NOP d = ((d ^ v23) >> ROTATE_16) | ((d ^ v23).yxwz << ROTATE_16); v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) << ROTATE_1) | ((b ^ v89).yxwz >> ROTATE_31); @@ -596,7 +589,6 @@ fn main(id: vec3) { * r=5, i=1, a=v[1], b=v[5], c=v[9], d=v[13], m[sigma]=?, m[sigma+1]=? */ x = vec4(m2, VEC2_0); - // y = VEC4_0; v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); @@ -604,7 +596,7 @@ fn main(id: vec3) { v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) >> ROTATE_24) | ((v45 ^ v89).yxwz << ROTATE_8); v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); - // v01 += y + vec4(0u, u32(v01.x + y.x < v01.x), 0u, u32(v01.z + y.z < v01.z)); + // NOP vCD = ((vCD ^ v01) >> ROTATE_16) | ((vCD ^ v01).yxwz << ROTATE_16); v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) << ROTATE_1) | ((v45 ^ v89).yxwz >> ROTATE_31); @@ -634,7 +626,6 @@ fn main(id: vec3) { b = vec4(v45.zw, v67.xy); d = vec4(vEF.zw, vCD.xy); x = vec4(m4, VEC2_0); - // y = VEC4_0; v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); @@ -642,7 +633,7 @@ fn main(id: vec3) { vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) >> ROTATE_24) | ((b ^ vAB).yxwz << ROTATE_8); v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); - // v01 += y + vec4(0u, u32(v01.x + y.x < v01.x), 0u, u32(v01.z + y.z < v01.z)); + // NOP d = ((d ^ v01) >> ROTATE_16) | ((d ^ v01).yxwz << ROTATE_16); vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) << ROTATE_1) | ((b ^ vAB).yxwz >> ROTATE_31); @@ -659,7 +650,6 @@ fn main(id: vec3) { b = vec4(v67.zw, v45.xy); d = vec4(vCD.zw, vEF.xy); x = vec4(VEC2_0, m1); - // y = VEC4_0; v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); @@ -667,7 +657,7 @@ fn main(id: vec3) { v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) >> ROTATE_24) | ((b ^ v89).yxwz << ROTATE_8); v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); - // v23 += y + vec4(0u, u32(v23.x + y.x < v23.x), 0u, u32(v23.z + y.z < v23.z)); + // NOP d = ((d ^ v23) >> ROTATE_16) | ((d ^ v23).yxwz << ROTATE_16); v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) << ROTATE_1) | ((b ^ v89).yxwz >> ROTATE_31); @@ -690,7 +680,6 @@ fn main(id: vec3) { * r=6, i=1, a=v[1], b=v[5], c=v[9], d=v[13], m[sigma]=?, m[sigma+1]=? */ // x = vec4(VEC2_0, m1); // still assigned this value from last assignment at r=5 i=6/7 - // y = VEC4_0; v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); @@ -698,7 +687,7 @@ fn main(id: vec3) { v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) >> ROTATE_24) | ((v45 ^ v89).yxwz << ROTATE_8); v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); - // v01 += y + vec4(0u, u32(v01.x + y.x < v01.x), 0u, u32(v01.z + y.z < v01.z)); + // NOP vCD = ((vCD ^ v01) >> ROTATE_16) | ((vCD ^ v01).yxwz << ROTATE_16); v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) << ROTATE_1) | ((v45 ^ v89).yxwz >> ROTATE_31); @@ -708,7 +697,6 @@ fn main(id: vec3) { * r=6, i=3, a=v[3], b=v[7], c=v[11], d=v[15], m[sigma]=?, m[sigma+1]=? */ x = vec4(VEC2_0, m4); - // y = VEC4_0; v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); @@ -716,7 +704,7 @@ fn main(id: vec3) { vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) >> ROTATE_24) | ((v67 ^ vAB).yxwz << ROTATE_8); v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); - // v23 += y + vec4(0u, u32(v23.x + y.x < v23.x), 0u, u32(v23.z + y.z < v23.z)); + // NOP vEF = ((vEF ^ v23) >> ROTATE_16) | ((vEF ^ v23).yxwz << ROTATE_16); vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) << ROTATE_1) | ((v67 ^ vAB).yxwz >> ROTATE_31); @@ -752,11 +740,10 @@ fn main(id: vec3) { */ b = vec4(v67.zw, v45.xy); d = vec4(vCD.zw, vEF.xy); - // x = VEC4_0; y = vec4(m2, VEC2_0); v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); - // v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); + // NOP d = (d ^ v23).yxwz; v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) >> ROTATE_24) | ((b ^ v89).yxwz << ROTATE_8); @@ -783,16 +770,13 @@ fn main(id: vec3) { * r=7, i=0, a=v[0], b=v[4], c=v[8], d=v[12], m[sigma]=?, m[sigma+1]=? * r=7, i=1, a=v[1], b=v[5], c=v[9], d=v[13], m[sigma]=?, m[sigma+1]=? */ - // x = VEC4_0; - // y = VEC4_0; - v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); - // v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); + // NOP vCD = (vCD ^ v01).yxwz; v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) >> ROTATE_24) | ((v45 ^ v89).yxwz << ROTATE_8); v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); - // v01 += y + vec4(0u, u32(v01.x + y.x < v01.x), 0u, u32(v01.z + y.z < v01.z)); + // NOP vCD = ((vCD ^ v01) >> ROTATE_16) | ((vCD ^ v01).yxwz << ROTATE_16); v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) << ROTATE_1) | ((v45 ^ v89).yxwz >> ROTATE_31); @@ -821,11 +805,10 @@ fn main(id: vec3) { */ b = vec4(v45.zw, v67.xy); d = vec4(vEF.zw, vCD.xy); - // x = VEC4_0; y = vec4(m0, m4); v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); - // v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); + // NOP d = (d ^ v01).yxwz; vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) >> ROTATE_24) | ((b ^ vAB).yxwz << ROTATE_8); @@ -847,7 +830,6 @@ fn main(id: vec3) { b = vec4(v67.zw, v45.xy); d = vec4(vCD.zw, vEF.xy); x = vec4(VEC2_0, m2); - // y = VEC4_0; v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); @@ -855,7 +837,7 @@ fn main(id: vec3) { v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) >> ROTATE_24) | ((b ^ v89).yxwz << ROTATE_8); v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); - // v23 += y + vec4(0u, u32(v23.x + y.x < v23.x), 0u, u32(v23.z + y.z < v23.z)); + // NOP d = ((d ^ v23) >> ROTATE_16) | ((d ^ v23).yxwz << ROTATE_16); v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) << ROTATE_1) | ((b ^ v89).yxwz >> ROTATE_31); @@ -877,16 +859,13 @@ fn main(id: vec3) { * r=8, i=0, a=v[0], b=v[4], c=v[8], d=v[12], m[sigma]=?, m[sigma+1]=? * r=8, i=1, a=v[1], b=v[5], c=v[9], d=v[13], m[sigma]=?, m[sigma+1]=? */ - // x = VEC4_0; - // y = VEC4_0; - v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); - // v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); + // NOP vCD = (vCD ^ v01).yxwz; v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) >> ROTATE_24) | ((v45 ^ v89).yxwz << ROTATE_8); v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); - // v01 += y + vec4(0u, u32(v01.x + y.x < v01.x), 0u, u32(v01.z + y.z < v01.z)); + // NOP vCD = ((vCD ^ v01) >> ROTATE_16) | ((vCD ^ v01).yxwz << ROTATE_16); v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) << ROTATE_1) | ((v45 ^ v89).yxwz >> ROTATE_31); @@ -915,11 +894,10 @@ fn main(id: vec3) { */ b = vec4(v45.zw, v67.xy); d = vec4(vEF.zw, vCD.xy); - // x = VEC4_0; y = vec4(m2, VEC2_0); v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); - // v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); + // NOP d = (d ^ v01).yxwz; vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) >> ROTATE_24) | ((b ^ vAB).yxwz << ROTATE_8); @@ -971,11 +949,10 @@ fn main(id: vec3) { * r=9, i=0, a=v[0], b=v[4], c=v[8], d=v[12], m[sigma]=?, m[sigma+1]=? * r=9, i=1, a=v[1], b=v[5], c=v[9], d=v[13], m[sigma]=?, m[sigma+1]=? */ - // x = VEC4_0; y = vec4(m2, m4); v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); - // v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); + // NOP vCD = (vCD ^ v01).yxwz; v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) >> ROTATE_24) | ((v45 ^ v89).yxwz << ROTATE_8); @@ -990,7 +967,6 @@ fn main(id: vec3) { * r=9, i=3, a=v[3], b=v[7], c=v[11], d=v[15], m[sigma]=?, m[sigma+1]=? */ x = vec4(VEC2_0, m1); - // y = VEC4_0; v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); @@ -998,7 +974,7 @@ fn main(id: vec3) { vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) >> ROTATE_24) | ((v67 ^ vAB).yxwz << ROTATE_8); v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); - // v23 += y + vec4(0u, u32(v23.x + y.x < v23.x), 0u, u32(v23.z + y.z < v23.z)); + // NOP vEF = ((vEF ^ v23) >> ROTATE_16) | ((vEF ^ v23).yxwz << ROTATE_16); vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) << ROTATE_1) | ((v67 ^ vAB).yxwz >> ROTATE_31); @@ -1009,16 +985,14 @@ fn main(id: vec3) { */ b = vec4(v45.zw, v67.xy); d = vec4(vEF.zw, vCD.xy); - // x = VEC4_0; - // y = VEC4_0; v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); - // v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); + // NOP d = (d ^ v01).yxwz; vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) >> ROTATE_24) | ((b ^ vAB).yxwz << ROTATE_8); v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); - // v01 += y + vec4(0u, u32(v01.x + y.x < v01.x), 0u, u32(v01.z + y.z < v01.z)); + // NOP d = ((d ^ v01) >> ROTATE_16) | ((d ^ v01).yxwz << ROTATE_16); vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) << ROTATE_1) | ((b ^ vAB).yxwz >> ROTATE_31); @@ -1084,7 +1058,6 @@ fn main(id: vec3) { * r=10, i=3, a=v[3], b=v[7], c=v[11], d=v[15], m[sigma]=?, m[sigma+1]=? */ x = vec4(m4, VEC2_0); - // y = VEC4_0; v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); @@ -1092,7 +1065,7 @@ fn main(id: vec3) { vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) >> ROTATE_24) | ((v67 ^ vAB).yxwz << ROTATE_8); v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); - // v23 += y + vec4(0u, u32(v23.x + y.x < v23.x), 0u, u32(v23.z + y.z < v23.z)); + // NOP vEF = ((vEF ^ v23) >> ROTATE_16) | ((vEF ^ v23).yxwz << ROTATE_16); vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) << ROTATE_1) | ((v67 ^ vAB).yxwz >> ROTATE_31); @@ -1103,16 +1076,14 @@ fn main(id: vec3) { */ b = vec4(v45.zw, v67.xy); d = vec4(vEF.zw, vCD.xy); - // x = VEC4_0; - // y = VEC4_0; v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); - // v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); + // NOP d = (d ^ v01).yxwz; vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) >> ROTATE_24) | ((b ^ vAB).yxwz << ROTATE_8); v01 += b + vec4(0u, u32(v01.x + b.x < v01.x), 0u, u32(v01.z + b.z < v01.z)); - // v01 += y + vec4(0u, u32(v01.x + y.x < v01.x), 0u, u32(v01.z + y.z < v01.z)); + // NOP d = ((d ^ v01) >> ROTATE_16) | ((d ^ v01).yxwz << ROTATE_16); vAB += d + vec4(0u, u32(vAB.x + d.x < vAB.x), 0u, u32(vAB.z + d.z < vAB.z)); b = ((b ^ vAB) << ROTATE_1) | ((b ^ vAB).yxwz >> ROTATE_31); @@ -1128,16 +1099,14 @@ fn main(id: vec3) { */ b = vec4(v67.zw, v45.xy); d = vec4(vCD.zw, vEF.xy); - // x = VEC4_0; - // y = VEC4_0; v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); - // v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); + // NOP d = (d ^ v23).yxwz; v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) >> ROTATE_24) | ((b ^ v89).yxwz << ROTATE_8); v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); - // v23 += y + vec4(0u, u32(v23.x + y.x < v23.x), 0u, u32(v23.z + y.z < v23.z)); + // NOP d = ((d ^ v23) >> ROTATE_16) | ((d ^ v23).yxwz << ROTATE_16); v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) << ROTATE_1) | ((b ^ v89).yxwz >> ROTATE_31); @@ -1160,7 +1129,6 @@ fn main(id: vec3) { * r=11, i=1, a=v[1], b=v[5], c=v[9], d=v[13], m[sigma]=?, m[sigma+1]=? */ x = vec4(VEC2_0, m4); - // y = VEC4_0; v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); v01 += x + vec4(0u, u32(v01.x + x.x < v01.x), 0u, u32(v01.z + x.z < v01.z)); @@ -1168,7 +1136,7 @@ fn main(id: vec3) { v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) >> ROTATE_24) | ((v45 ^ v89).yxwz << ROTATE_8); v01 += v45 + vec4(0u, u32(v01.x + v45.x < v01.x), 0u, u32(v01.z + v45.z < v01.z)); - // v01 += y + vec4(0u, u32(v01.x + y.x < v01.x), 0u, u32(v01.z + y.z < v01.z)); + // NOP vCD = ((vCD ^ v01) >> ROTATE_16) | ((vCD ^ v01).yxwz << ROTATE_16); v89 += vCD + vec4(0u, u32(v89.x + vCD.x < v89.x), 0u, u32(v89.z + vCD.z < v89.z)); v45 = ((v45 ^ v89) << ROTATE_1) | ((v45 ^ v89).yxwz >> ROTATE_31); @@ -1177,16 +1145,13 @@ fn main(id: vec3) { * r=11, i=2, a=v[2], b=v[6], c=v[10], d=v[14], m[sigma]=?, m[sigma+1]=? * r=11, i=3, a=v[3], b=v[7], c=v[11], d=v[15], m[sigma]=?, m[sigma+1]=? */ - // x = VEC4_0; - // y = VEC4_0; - v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); - // v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); + // NOP vEF = (vEF ^ v23).yxwz; vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) >> ROTATE_24) | ((v67 ^ vAB).yxwz << ROTATE_8); v23 += v67 + vec4(0u, u32(v23.x + v67.x < v23.x), 0u, u32(v23.z + v67.z < v23.z)); - // v23 += y + vec4(0u, u32(v23.x + y.x < v23.x), 0u, u32(v23.z + y.z < v23.z)); + // NOP vEF = ((vEF ^ v23) >> ROTATE_16) | ((vEF ^ v23).yxwz << ROTATE_16); vAB += vEF + vec4(0u, u32(vAB.x + vEF.x < vAB.x), 0u, u32(vAB.z + vEF.z < vAB.z)); v67 = ((v67 ^ vAB) << ROTATE_1) | ((v67 ^ vAB).yxwz >> ROTATE_31); @@ -1222,11 +1187,10 @@ fn main(id: vec3) { */ b = vec4(v67.zw, v45.xy); d = vec4(vCD.zw, vEF.xy); - // x = VEC4_0; y = vec4(VEC2_0, m3); v23 += b + vec4(0u, u32(v23.x + b.x < v23.x), 0u, u32(v23.z + b.z < v23.z)); - // v23 += x + vec4(0u, u32(v23.x + x.x < v23.x), 0u, u32(v23.z + x.z < v23.z)); + // NOP d = (d ^ v23).yxwz; v89 += d + vec4(0u, u32(v89.x + d.x < v89.x), 0u, u32(v89.z + d.z < v89.z)); b = ((b ^ v89) >> ROTATE_24) | ((b ^ v89).yxwz << ROTATE_8);