From fe553b0896a561ef34570b4ff1e81eec9a3b0bd5 Mon Sep 17 00:00:00 2001 From: Sun Yimin Date: Thu, 9 Oct 2025 10:49:27 +0800 Subject: [PATCH] =?UTF-8?q?Updated=20sm2=5Fz256=5Floong64.S=20=E4=BB=A3?= =?UTF-8?q?=E7=A0=81=E5=88=86=E6=9E=90=20(markdown)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- sm2_z256_loong64.S-代码分析.md | 1 + 1 file changed, 1 insertion(+) diff --git a/sm2_z256_loong64.S-代码分析.md b/sm2_z256_loong64.S-代码分析.md index d79355e..e3e4569 100644 --- a/sm2_z256_loong64.S-代码分析.md +++ b/sm2_z256_loong64.S-代码分析.md @@ -75,6 +75,7 @@ $T_3=T + T_2=(t_4+t_0-t_0>>32) \ast 2^{256}+(t_3 - t_0<<32) \ast 2^{192} + (t_2 1. 几个**no carry**判断的准确性: 1. https://github.com/DengJianbo-loongson/GmSSL/blob/2497946ac6458ae1fb6931b66804dbc62cfffe44/src/sm2_z256_loong64.S#L268 `add.d $t5, $a1, $t5`,这里`$a1`是可能的进位,这一点是不一定成立的。但是,如果把它和261行`add.d $t5, $t5, $s2`交换一下顺序,则成立,因为两个64位字的乘法产生的高64位字,不可能是 $2^{64}-1$ ,所以结果是否正确,需要进一步证明,并没那么直观。 1. https://github.com/DengJianbo-loongson/GmSSL/blob/2497946ac6458ae1fb6931b66804dbc62cfffe44/src/sm2_z256_loong64.S#L273 这里是成立的。 +1. 约简还没完成,也就是 $ T_2 + T $ 还没算完,就开始了下一个字的乘法,代码可读性降低,为了性能?