Updated sm2_z256_loong64.S 代码分析 (markdown)

Sun Yimin 2025-10-09 10:46:29 +08:00
parent 254177b21a
commit 955087c0d0

@ -74,6 +74,7 @@ $T_3=T + T_2=(t_4+t_0-t_0>>32) \ast 2^{256}+(t_3 - t_0<<32) \ast 2^{192} + (t_2
它这里先计算T的系数(WORD),再计算 $T_2$ 的系数。 它这里先计算T的系数(WORD),再计算 $T_2$ 的系数。
1. 几个**no carry**判断的准确性: 1. 几个**no carry**判断的准确性:
1. https://github.com/DengJianbo-loongson/GmSSL/blob/2497946ac6458ae1fb6931b66804dbc62cfffe44/src/sm2_z256_loong64.S#L268 `add.d $t5, $a1, $t5`,这里`$a1`是可能的进位这一点是不一定成立的。但是如果把它和261行`add.d $t5, $t5, $s2`交换一下顺序则成立因为两个64位字的乘法产生的高64位字不可能是 $2^{64}-1$ ,所以结果是否正确,需要进一步证明,并没那么直观。 1. https://github.com/DengJianbo-loongson/GmSSL/blob/2497946ac6458ae1fb6931b66804dbc62cfffe44/src/sm2_z256_loong64.S#L268 `add.d $t5, $a1, $t5`,这里`$a1`是可能的进位这一点是不一定成立的。但是如果把它和261行`add.d $t5, $t5, $s2`交换一下顺序则成立因为两个64位字的乘法产生的高64位字不可能是 $2^{64}-1$ ,所以结果是否正确,需要进一步证明,并没那么直观。
1. https://github.com/DengJianbo-loongson/GmSSL/blob/2497946ac6458ae1fb6931b66804dbc62cfffe44/src/sm2_z256_loong64.S#L273 这里是成立的。