如何解决将参数std :: min的顺序更改为浮点数的编译器输出
我在摆弄Compiler Explorer时,发现传递给std :: min的参数顺序更改了发出的程序集。
Here's the example on Godbolt Compiler Explorer
double std_min_xy(double x,double y) {
return std::min(x,y);
}
double std_min_yx(double x,double y) {
return std::min(y,x);
}
这被编译为(例如,在clang 9.0.0上带有-O3)为:
std_min_xy(double,double): # @std_min_xy(double,double)
minsd xmm1,xmm0
movapd xmm0,xmm1
ret
std_min_yx(double,double): # @std_min_yx(double,double)
minsd xmm0,xmm1
ret
如果我将std :: min更改为老式的三元运算符,这种情况仍然存在。它在我尝试过的所有现代编译器(clang,gcc,icc)中也仍然有效。
基础指令是minsd
。阅读文档时,minsd
的第一个参数也是答案的目的地。显然,xmm0是我的函数应该放置其返回值的位置,因此,如果将xmm0用作第一个参数,则不需要movapd
。但是,如果xmm0是第二个参数,则必须movapd xmm0,xmm1
才能将值放入xmm0。 (编者注:是的,x86-64 System V在xmm0,xmm1等中传递FP args,并在xmm0中返回。)
我的问题:编译器为什么不切换参数本身的顺序,因此不需要movapd
?当然必须知道,minsd的参数顺序不会改变答案吗?有我不喜欢的副作用吗?
解决方法
minsd a,b
对于某些特殊FP值不是可交换的,std::min
也不是可交换的,除非您使用-ffast-math
。
minsd a,b
完全实现(a<b) ? a : b
,其中包括严格意义上的IEEE-754语义中涉及零号和NaN的所有内容。 (即,将源操作数b
保持为无序 1 或相等)。正如Artyer指出的那样,-0.0
和+0.0
比较相等(即-0. < 0.
为假),但是它们是不同的。
std::min
是根据(a<b)
比较表达式(cppreference)定义的,其中(a<b) ? a : b
是一种可能的实现方式,而std::fmin
可以保证NaN传播来自任何一个操作数,等等。 ({fmin
最初来自C数学库,而不是C ++模板。)
有关minss / minsd / maxss / maxsd(以及相应的内在函数,除了某些GCC版本外,它们遵循相同的非交换规则),请参见What is the instruction that gives branchless FP min and max on x86?。
脚注1:请记住,NaN<b
对任何b
以及任何比较谓词都是错误的。例如NaN == b
为假,NaN > b
也为假。甚至NaN == NaN
都是错误的。当一对中的一个或多个是NaN时,它们是“无序的”。彼此。
使用-ffast-math
(告诉编译器不假设NaN,以及其他假设和近似值),编译器 会将任一函数优化为单个minsd
。 https://godbolt.org/z/a7oK91
对于GCC,请参见https://gcc.gnu.org/wiki/FloatingPointMath
clang支持类似的选项,包括-ffast-math
作为包罗万象的东西。
除了奇怪的旧版代码库(例如, -fno-math-errno
。 (请参见this Q&A for more about recommended math optimizations)。而且gcc -fno-trapping-math
是一个好主意,因为尽管默认情况下处于启用状态,但它仍然无法完全正常工作(某些优化仍可以更改在未屏蔽异常的情况下会引发的FP异常的数量,包括有时甚至从1起设为0或0设为非零(IIRC)。 gcc -ftrapping-math
还会阻止一些即使100%安全的优化。异常语义,因此非常糟糕。在不使用fenv.h
的代码中,您永远不会知道区别。
但是将std::min
视为可交换对象只能使用不带NaN的选项来实现,并且类似的东西,因此对于关心代码的人绝对不能称为“安全” NaN到底发生了什么。例如-ffinite-math-only
假设没有NaN(也没有无穷大)
clang -funsafe-math-optimizations -ffinite-math-only
将执行您要寻找的优化。 (不安全的数学优化意味着一堆更具体的选择,包括不关心带符号的零语义)。
考虑:std::signbit(std::min(+0.0,-0.0)) == false && std::signbit(std::min(-0.0,+0.0)) == true
。
唯一的区别是,如果两个参数都是(可能是不同的)NaN,则应返回第二个参数。
您可以允许gcc通过使用-funsafe-math-optimizations -fno-math-errno
优化(均由-ffast-math
启用)对参数重新排序。 unsafe-math-optimizations
允许编译器不关心有符号的零,finite-math-only
则不关心NaNs
要扩展现有的说std::min
不可交换的答案:这是一个具体示例,可以可靠地区分std_min_xy
与std_min_yx
。 Godbolt:
bool distinguish1() {
return 1 / std_min_xy(0.0,-0.0) > 0.0;
}
bool distinguish2() {
return 1 / std_min_yx(0.0,-0.0) > 0.0;
}
distinguish1()
的值为1 / 0.0 > 0.0
,即INFTY > 0.0
或true
。distinguish2()
的值为1 / -0.0 > 0.0
,即-INFTY > 0.0
或false
。
(当然,所有这些都是在IEEE规则下完成的。我不认为编译器会保留这种特定行为的C ++标准授权。老实说,令我惊讶的是,表达式-0.0
的求值实际上是负数。首先是零!
-ffinite-math-only
eliminates this way of telling the difference和-ffinite-math-only -funsafe-math-optimizations
completely eliminates the difference in codegen。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。