Delphi代码优化（三）浮点篇

撰文/杜嵩月光转载自程序员杂志第三期

忘掉extended

extended很大（10字节，如果代码对齐就有12字节），读写运算都很慢，是优化的大敌。且Delphi2-4对extended的代码对齐有bug。因此，若非必要，不要用extended。

同时，在混合浮点类型的运算中，编译器为了不丢失精度，临时变量以extended类型存储，所以要避免混合浮点运算。

还有，用const定义的常量，如不加指明，则也默认为extended类型。解决办法是，配合$J指示字，定义指明类型常量（typed constand）。

改变FPU控制字

默认的FPU控制字令除法运算和PII/PIII上的平方根运算慢而精确，当无须得到这样的结果时，可用Set8087CW让FPU“偷懒”。

对于Single类型:Set8087CW(Default8087CW and $FCFF)

对于Double类型:Set8087CW((Default8087CW and $FCFF) or $0200)

对于extended类型:Set8087CW(Default8087CW or $0300)

多用Round

Trunc会读写FPU指令字，而Round不会，所以可以的话，尽量用Round。

传送实参

对于返回浮点值的函数，入口和出口处会有附加的压栈退栈，对形如:

function func(x : SomeType): SomeFloat;

不妨改写为:

procedure func(x : SomeType; var fp : SomeFloat);

对于在过程中未修改的浮点形参，没必要用const修饰，因为那除了增加一个编译期检查外，别无用处。相应的对策是用var修饰为实参，强制传址。

自己动手，丰衣足食

Delphi本身不对浮点运算作任何优化，因此很多时候，还得自己用汇编来解决。

值得注意的是，Delphi中浮点异常的触发，不是在出错之后，而是在下一条浮点指令之前。因此，通常的作法是，在一次浮点操作完毕后，加一条FWAIT指令。

减少除法

除法，即多次的减法，其代价是相当昂贵的，因而有必要减少除法的次数。

另外，对于简单除法（如:a/5），编译器不一定（？！）会将其变为乘法（a*0.2），比如:

fp:=fp*3*4/5+3*4/2;

在Delphi 4中，会被编译为:

fp:=fp*3*4/5+6;

而只有:

fp:=3*4/5*fp+3*4/2;

才会被编译为:

fp:=2.4*fp+6;

鉴于编译器的繁复规则，建议这一步优化自己完成。

浮点零的检查

检查一个浮点数是否为零，如果简单的“Afloat=0”，会把0转换为浮点零。而更好的办法是这样:

对于Single类型:(Dword(pointer(Asingle))shl 1) =0

对于Double类型:

type

DoubleData=record lo,hi:Dword end;

Var

ADouble:Double;

Dd:DoubleData absolute Adouble;

begin

…

if ((dd.hi shl 1)+dd.lo)=0 then …

end;

此法在PII上有30%-40%的效率提升。

Delphi代码优化（三） 浮点篇