优化代码,看看哪个执行速度更快!!!

王朝delphi·作者佚名  2006-01-09
窄屏简体版  字體: |||超大  

优化代码,看看哪个执行速度更快!!!

最近我编写一个小程序,其用一个函数将 A,B 值互换,因为该函数调用频繁,于是对其优化,以下有三个版本,请试试看Rev1, Rev2, Rev3三个函数哪个执行速度更快。

// Delphi 代码如下:

unit Unit1;

// Created By BHB. 2004-08-31

interface

uses

Windows, Messages, SysUtils, Classes, Graphics, Controls, Forms,

Dialogs, StdCtrls;

type

TForm1 = class(TForm)

procedure FormCreate(Sender: TObject);

private

public

{ Public declarations }

end;

var

Form1: TForm1;

implementation

{$R *.dfm}

// 高精度计时

function XTimer(var t0: Int64; bStart: Bool): Int64;

var

t, fq: Int64;

begin

QueryPerformanceCounter(t);

if bStart then

t0 := t

else begin

t := t - t0;

QueryPerformanceFrequency(fq);

Result := trunc(t / fq * 1000);

end;

end;

procedure Rev1(var a, b: Integer);

begin

asm

MOV ECX, [EDX]

XCHG [EAX], ECX

MOV [EDX], ECX

end;

end;

procedure Rev2(var a, b: Integer);

begin

a := a xor b;

b := a xor b;

a := a xor b;

end;

procedure Rev3(var a, b: Integer);

var

t: Integer;

begin

t := a;

a := b;

b := t;

end;

procedure TForm1.FormCreate(Sender: TObject);

type

TRevFun = procedure(var a, b: Integer);

var

S: string;

a, b: Integer;

T: Int64;

procedure Test(const RevName: string; Rev: TRevFun);

var

I: Integer;

begin

XTimer(T, True); // 计时开始

// 一千万次循环

for I := 0 to 10000000 do Rev(a, b);

T := XTimer(T, False); // 计时结束

S := S + RevName + Format(' 耗时: %d 毫秒.'#13#10, [T]);

end;

begin

a := 123;

b := 321;

Test('Rev1', Rev1);

Test('Rev2', Rev2);

Test('Rev3', Rev3);

ShowMessage(S);

end;

end.

如果你认为汇编执行速度更快,可能会选 Rev1;

如果你看过优化方面的书,可能会选 Rev2,几乎百分之百的教科书都这样写的,XOR操作速度更快;

如果你刚学计算机,可能会做这个程序练习,Rev3 的方法简单、易理解。

倒底哪个更快呢,以下是不同平台下的执行结果:(值越小速度越快)

AMD Duron 750MHz 执行结果:

P4 2.00GHz 执行结果:

怎么样出乎意料之外吧, 不管哪种平台, 尽管它们的执行时间长短有差别, 但对应的执行速度都为: Rev3 > Rev2 > Rev1

Rev1 用汇编指令写的代码在P4机器上执行速度却比最快的 Rev3 慢上近十倍,在AMD机器的表现也慢了近三倍;

Rev2 是书上的标准答案,异或操作本应更快, 可测试结果却并非如此...

Rev3 取得了最后的胜利,这足以颠覆我们的惯性思维,最简单的编程方法编出的代码反而执行最快, 其实细想一下, 其实道理也很简单, Rev1 虽然只用三条汇编指令就完成功能,是三个函数中使用汇编语句最少的(其它两个函数都分别用六条汇编指令实现的), 但其中 XCHG 指令执行却颇耗时间, 在P4机器上的表现最为实出; 同理 Rev2 亦是如此, 它没有用到临时变量, 就是两个数的XOR操作, 本应比 Rev3 快, 但实际中却败下阵来, 究其原因也是因为 XOR 操作要比 Rev3 的赋值指令 MOV 要更耗费时间; Rev3 中的虽然用到了一个临时变量用于保存中间值,但一个压栈、弹栈并不会耗用多少时间,其余的汇编指令就是使用MOV,而MOV指令是CPU使用最频的汇编指令,所以厂家对该指令的硬件电路设计上一定会进行更好的优化,故Rev3在最终胜出也就不足为怪了。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航