我已经能够与编译器的一个版本重现该问题。
矿是MinGW g ++ 4.6.2。
当我编译程序为g++ -g -O2 bugflt.cpp -o bugflt.exe
时,我得到720720
。
这是main()
拆卸:
_main:
pushl %ebp
movl %esp, %ebp
andl $-16, %esp
subl $16, %esp
call ___main
movl $720720, 4(%esp)
movl $__ZSt4cout, (%esp)
call __ZNSolsEi
movl %eax, (%esp)
call __ZSt4endlIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_
xorl %eax, %eax
leave
ret
正如你可以看到,该值是在编译时计算。
当我编译为g++ -g -O2 -fno-inline bugflt.cpp -o bugflt.exe
时,我得到720719
。
这是main()
拆卸:
_main:
pushl %ebp
movl %esp, %ebp
andl $-16, %esp
subl $32, %esp
call ___main
movl $1, 4(%esp)
movl $13, (%esp)
call __ZSt3powIiiEN9__gnu_cxx11__promote_2INS0_11__enable_ifIXaasrSt15__is_arithmeticIT_E7__valuesrS3_IT0_E7__valueES4_E6__typeES6_E6__typeES4_S6_
fmuls LC1
fnstcw 30(%esp)
movw 30(%esp), %ax
movb $12, %ah
movw %ax, 28(%esp)
fldcw 28(%esp)
fistpl 4(%esp)
fldcw 30(%esp)
movl $__ZSt4cout, (%esp)
call __ZNSolsEi
movl $__ZSt4endlIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_, 4(%esp)
movl %eax, (%esp)
call __ZNSolsEPFRSoS_E
xorl %eax, %eax
leave
ret
...
LC1:
.long 1196986368 // 55440.0 exactly
如果我更换呼叫exp()
与装载13.0这样的:
_main:
pushl %ebp
movl %esp, %ebp
andl $-16, %esp
subl $32, %esp
call ___main
movl $1, 4(%esp)
movl $13, (%esp)
// call __ZSt3powIiiEN9__gnu_cxx11__promote_2INS0_11__enable_ifIXaasrSt15__is_arithmeticIT_E7__valuesrS3_IT0_E7__valueES4_E6__typeES6_E6__typeES4_S6_
fildl (%esp)
fmuls LC1
fnstcw 30(%esp)
movw 30(%esp), %ax
movb $12, %ah
movw %ax, 28(%esp)
fldcw 28(%esp)
fistpl 4(%esp)
fldcw 30(%esp)
movl $__ZSt4cout, (%esp)
call __ZNSolsEi
movl $__ZSt4endlIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_, 4(%esp)
movl %eax, (%esp)
call __ZNSolsEPFRSoS_E
xorl %eax, %eax
leave
ret
我得到720720
。
如果我设置的x87 FPU控制字的相同的舍入和精度控制字段的exp()
时间为这样的fistpl 4(%esp)
指令:
_main:
pushl %ebp
movl %esp, %ebp
andl $-16, %esp
subl $32, %esp
call ___main
movl $1, 4(%esp)
movl $13, (%esp)
fnstcw 30(%esp)
movw 30(%esp), %ax
movb $12, %ah
movw %ax, 28(%esp)
fldcw 28(%esp)
call __ZSt3powIiiEN9__gnu_cxx11__promote_2INS0_11__enable_ifIXaasrSt15__is_arithmeticIT_E7__valuesrS3_IT0_E7__valueES4_E6__typeES6_E6__typeES4_S6_
fldcw 30(%esp)
fmuls LC1
fnstcw 30(%esp)
movw 30(%esp), %ax
movb $12, %ah
movw %ax, 28(%esp)
fldcw 28(%esp)
fistpl 4(%esp)
fldcw 30(%esp)
movl $__ZSt4cout, (%esp)
call __ZNSolsEi
movl $__ZSt4endlIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_, 4(%esp)
movl %eax, (%esp)
call __ZNSolsEPFRSoS_E
xorl %eax, %eax
leave
ret
我得到720720
为好。
从这个我只能得出这样的结论exp()
未计算13 精确地13.0。
可能看着那__gnu_cxx::__promote_2<__gnu_cxx::__enable_if<(std::__is_arithmetic<int>::__value)&&(std::__is_arithmetic<int>::__value), int>::__type, int>::__type std::pow<int, int>(int, int)
的源代码,看看它究竟是如何管理搞砸幂与整数值(见,这与C的exp()
需要两个ints
,而不是两个doubles
)。
但我不会责怪exp()
。除C的double pow(double, double)
之外,C++ 11还定义了float pow(float, float)
和long double pow(long double, long double)
。但标准中没有double pow(int, int)
。
编译器为整型参数提供版本的事实不会对结果的精度做任何额外的保证。如果exp()
计算b作为
一个b = 2 b *表登录的(a)
或作为
一个b = e b * ln(a)
对于浮点值,这个过程肯定会有舍入误差。
如果exp()
的“整数”版本做了类似的操作,并且由于舍入错误而导致类似的精度损失,它仍然可以正常工作。即使精度的损失是由于一些愚蠢的错误,而不是由于正常的舍入错误造成的。
然而令人惊讶的是,这种行为可能看起来是正确的。或者我相信,直到证明错误。
结果如何?什么是编译器标志? – 2013-03-10 06:17:38
另外,什么是gcc版本?这很可能是一个编译器错误。 我得到正确的答案(720720)与海湾合作委员会4.7.2 – 2013-03-10 06:20:57
你为什么写这样奇怪的代码? – Pubby 2013-03-10 06:21:50