优化代码,看看哪个执行速度更快!!!
最近我编写一个小程序,其用一个函数将 A,B 值互换,因为该函数调用频繁,于是对其优化,以下有三个版本,请试试看Rev1, Rev2, Rev3三个函数哪个执行速度更快。
// Delphi 代码如下:
unit Unit1;
// Created By BHB. 2004-08-31
interface
uses
Windows, Messages, SysUtils, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls;
type
TForm1 = class(TForm)
procedure FormCreate(Sender: TObject);
private
public
{ Public declarations }
end;
var
Form1: TForm1;
implementation
{$R *.dfm}
// 高精度计时
function XTimer(var t0: Int64; bStart: Bool): Int64;
var
t, fq: Int64;
begin
QueryPerformanceCounter(t);
if bStart then
t0 := t
else begin
t := t - t0;
QueryPerformanceFrequency(fq);
Result := trunc(t / fq * 1000);
end;
end;
procedure Rev1(var a, b: Integer);
begin
asm
MOV ECX, [EDX]
XCHG [EAX], ECX
MOV [EDX], ECX
end;
end;
procedure Rev2(var a, b: Integer);
begin
a := a xor b;
b := a xor b;
a := a xor b;
end;
procedure Rev3(var a, b: Integer);
var
t: Integer;
begin
t := a;
a := b;
b := t;
end;
procedure TForm1.FormCreate(Sender: TObject);
type
TRevFun = procedure(var a, b: Integer);
var
S: string;
a, b: Integer;
T: Int64;
procedure Test(const RevName: string; Rev: TRevFun);
var
I: Integer;
begin
XTimer(T, True); // 计时开始
// 一千万次循环
for I := 0 to 10000000 do Rev(a, b);
T := XTimer(T, False); // 计时结束
S := S + RevName + Format(' 耗时: %d 毫秒.'#13#10, [T]);
end;
begin
a := 123;
b := 321;
Test('Rev1', Rev1);
Test('Rev2', Rev2);
Test('Rev3', Rev3);
ShowMessage(S);
end;
end.
如果你认为汇编执行速度更快,可能会选 Rev1;
如果你看过优化方面的书,可能会选 Rev2,几乎百分之百的教科书都这样写的,XOR操作速度更快;
如果你刚学计算机,可能会做这个程序练习,Rev3 的方法简单、易理解。
倒底哪个更快呢,以下是不同平台下的执行结果:(值越小速度越快)
AMD Duron 750MHz 执行结果:
P4 2.00GHz 执行结果:
怎么样出乎意料之外吧, 不管哪种平台, 尽管它们的执行时间长短有差别, 但对应的执行速度都为: Rev3 > Rev2 > Rev1
Rev1 用汇编指令写的代码在P4机器上执行速度却比最快的 Rev3 慢上近十倍,在AMD机器的表现也慢了近三倍;
Rev2 是书上的标准答案,异或操作本应更快, 可测试结果却并非如此...
Rev3 取得了最后的胜利,这足以颠覆我们的惯性思维,最简单的编程方法编出的代码反而执行最快, 其实细想一下, 其实道理也很简单, Rev1 虽然只用三条汇编指令就完成功能,是三个函数中使用汇编语句最少的(其它两个函数都分别用六条汇编指令实现的), 但其中 XCHG 指令执行却颇耗时间, 在P4机器上的表现最为实出; 同理 Rev2 亦是如此, 它没有用到临时变量, 就是两个数的XOR操作, 本应比 Rev3 快, 但实际中却败下阵来, 究其原因也是因为 XOR 操作要比 Rev3 的赋值指令 MOV 要更耗费时间; Rev3 中的虽然用到了一个临时变量用于保存中间值,但一个压栈、弹栈并不会耗用多少时间,其余的汇编指令就是使用MOV,而MOV指令是CPU使用最频的汇编指令,所以厂家对该指令的硬件电路设计上一定会进行更好的优化,故Rev3在最终胜出也就不足为怪了。