如何解决了解clang循环优化
我有这段代码
#include <cstdlib>
#include <time.h>
int sum () {
srand (time(NULL));
unsigned long extra = rand() % 10;
int sum = 0;
// #pragma nounroll. <<<< This makes no difference
for (int i = 0; i < 16 + extra; ++i) {
sum += i;
}
return sum;
}
并使用-O3
,clang将其优化为以下内容,这让我大吃一惊。 (请注意,没有分支)
我真的不明白如何证明这种优化的正确性。
具体来说,使用两个看似魔术的数字(顺便说一句,在编译之间不会改变)似乎是令人迷惑的。此外,我想您称这些为“随机”,但不是出于rand()
的精神,不是吗?
sum(): # @sum()
push rax
xor edi,edi
call time
mov edi,eax
call srand
call rand
cdqe
imul rcx,rax,1717986919. # <<<< magic number
mov rdx,rcx
shr rdx,63
sar rcx,34
add ecx,edx
add ecx,ecx
lea ecx,[rcx + 4*rcx]
mov edx,eax
sub edx,ecx
neg ecx
add eax,ecx
add eax,16
lea rcx,[rax - 1]
movabs rsi,8589934590 # <<< magic number
add rsi,rax
imul rsi,rcx
shr rsi
lea eax,[rsi + rdx]
add eax,15
pop rcx
ret
为后代,海湾合作委员会提供了以下内容
sum():
sub rsp,8
xor edi,edi
call time
mov rdi,rax
call srand
call rand
mov esi,1
movsx rdx,eax
mov ecx,eax
imul rdx,rdx,1717986919
sar ecx,31
sar rdx,34
sub edx,[rdx+rdx*4]
add ecx,ecx
sub eax,ecx
mov edx,eax
add eax,16
movsx rcx,eax
cmp edx,-16
cmovne rsi,rcx
cmp eax,18
jbe .L6
mov rdx,rsi
movdqa xmm1,XMMWORD PTR .LC0[rip]
pxor xmm0,xmm0
xor eax,eax
movdqa xmm3,XMMWORD PTR .LC1[rip]
shr rdx,2
.L3:
movdqa xmm2,xmm1
add eax,1
paddd xmm1,xmm3
paddd xmm0,xmm2
cmp eax,edx
jne .L3
movdqa xmm1,xmm0
mov rdi,rsi
psrldq xmm1,8
and rdi,-4
paddd xmm0,xmm1
movsx rdx,edi
movdqa xmm1,xmm0
psrldq xmm1,4
paddd xmm0,xmm1
movd eax,xmm0
cmp rsi,rdi
je .L1
.L5:
add eax,edx
add rdx,1
cmp rcx,rdx
ja .L5
.L1:
add rsp,8
ret
.L6:
xor edx,edx
xor eax,eax
jmp .L5
.LC0:
.long 0
.long 1
.long 2
.long 3
.LC1:
.long 4
.long 4
.long 4
.long 4
解决方法
代码确实调用rand
,这就足够了。返回值将保存在rax寄存器中。如果将2³²**除以1717986919,您将得到2.499999999126885,该值非常接近10/4 ...使用常数(带移位)可以计算% 10
,而不必使用昂贵的idiv
操作码
此后,结果只是1 + 2 + 3 ... + n的算术级数的前n个项之和,即n(n + 1) / 2。第二个幻数与此计算有关。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。