将参数std :: min的顺序更改为浮点数的编译器输出

如何解决将参数std :: min的顺序更改为浮点数的编译器输出

我在摆弄Compiler Explorer时，发现传递给std :: min的参数顺序更改了发出的程序集。

Here's the example on Godbolt Compiler Explorer

double std_min_xy(double x,double y) {
    return std::min(x,y);
}

double std_min_yx(double x,double y) {
    return std::min(y,x);
}

这被编译为（例如，在clang 9.0.0上带有-O3）为：

std_min_xy(double,double):                       # @std_min_xy(double,double)
        minsd   xmm1,xmm0
        movapd  xmm0,xmm1
        ret
std_min_yx(double,double):                       # @std_min_yx(double,double)
        minsd   xmm0,xmm1
        ret

如果我将std :: min更改为老式的三元运算符，这种情况仍然存在。它在我尝试过的所有现代编译器（clang，gcc，icc）中也仍然有效。

基础指令是minsd。阅读文档时，minsd的第一个参数也是答案的目的地。显然，xmm0是我的函数应该放置其返回值的位置，因此，如果将xmm0用作第一个参数，则不需要movapd。但是，如果xmm0是第二个参数，则必须movapd xmm0,xmm1才能将值放入xmm0。（编者注：是的，x86-64 System V在xmm0，xmm1等中传递FP args，并在xmm0中返回。）

我的问题：编译器为什么不切换参数本身的顺序，因此不需要movapd？当然必须知道，minsd的参数顺序不会改变答案吗？有我不喜欢的副作用吗？

解决方法

minsd a,b对于某些特殊FP值不是可交换的，std::min 也不是可交换的，除非您使用-ffast-math。

minsd a,b 完全实现(a<b) ? a : b，其中包括严格意义上的IEEE-754语义中涉及零号和NaN的所有内容。（即，将源操作数b保持为无序¹或相等）。正如Artyer指出的那样，-0.0和+0.0比较相等（即-0. < 0.为假），但是它们是不同的。

std::min是根据(a<b)比较表达式（cppreference）定义的，其中(a<b) ? a : b是一种可能的实现方式，而std::fmin可以保证NaN传播来自任何一个操作数，等等。（{fmin最初来自C数学库，而不是C ++模板。）

有关minss / minsd / maxss / maxsd（以及相应的内在函数，除了某些GCC版本外，它们遵循相同的非交换规则），请参见What is the instruction that gives branchless FP min and max on x86?。

脚注1：请记住，NaN<b对任何b以及任何比较谓词都是错误的。例如NaN == b为假，NaN > b也为假。甚至NaN == NaN都是错误的。当一对中的一个或多个是NaN时，它们是“无序的”。彼此。

使用-ffast-math（告诉编译器不假设NaN，以及其他假设和近似值），编译器会将任一函数优化为单个minsd。 https://godbolt.org/z/a7oK91

对于GCC，请参见https://gcc.gnu.org/wiki/FloatingPointMath
clang支持类似的选项，包括-ffast-math作为包罗万象的东西。

除了奇怪的旧版代码库（例如， -fno-math-errno。（请参见this Q&A for more about recommended math optimizations）。而且gcc -fno-trapping-math是一个好主意，因为尽管默认情况下处于启用状态，但它仍然无法完全正常工作（某些优化仍可以更改在未屏蔽异常的情况下会引发的FP异常的数量，包括有时甚至从1起设为0或0设为非零（IIRC）。 gcc -ftrapping-math还会阻止一些即使100％安全的优化。异常语义，因此非常糟糕。在不使用fenv.h的代码中，您永远不会知道区别。

但是将std::min视为可交换对象只能使用不带NaN的选项来实现，并且类似的东西，因此对于关心代码的人绝对不能称为“安全” NaN到底发生了什么。例如-ffinite-math-only假设没有NaN（也没有无穷大）

clang -funsafe-math-optimizations -ffinite-math-only将执行您要寻找的优化。（不安全的数学优化意味着一堆更具体的选择，包括不关心带符号的零语义）。

考虑：std::signbit(std::min(+0.0,-0.0)) == false && std::signbit(std::min(-0.0,+0.0)) == true。

唯一的区别是，如果两个参数都是（可能是不同的）NaN，则应返回第二个参数。

您可以允许gcc通过使用-funsafe-math-optimizations -fno-math-errno优化（均由-ffast-math启用）对参数重新排序。 unsafe-math-optimizations允许编译器不关心有符号的零，finite-math-only则不关心NaNs

要扩展现有的说std::min不可交换的答案：这是一个具体示例，可以可靠地区分std_min_xy与std_min_yx。 Godbolt:

bool distinguish1() {
    return 1 / std_min_xy(0.0,-0.0) > 0.0;
}
bool distinguish2() {
    return 1 / std_min_yx(0.0,-0.0) > 0.0;
}

distinguish1()的值为1 / 0.0 > 0.0，即INFTY > 0.0或true。
distinguish2()的值为1 / -0.0 > 0.0，即-INFTY > 0.0或false。
（当然，所有这些都是在IEEE规则下完成的。我不认为编译器会保留这种特定行为的C ++标准授权。老实说，令我惊讶的是，表达式-0.0的求值实际上是负数。首先是零！

-ffinite-math-only eliminates this way of telling the difference和-ffinite-math-only -funsafe-math-optimizations completely eliminates the difference in codegen。

将参数std :: min的顺序更改为浮点数的编译器输出

如何解决将参数std :: min的顺序更改为浮点数的编译器输出

解决方法

相关推荐