剖析Delphi中的构造和析构
1 Delphi中的对象模型: 2
1.1 对象名表示什么? 2
1.2 对象存储在哪里? 2
1.3 对象中存储了什么?它们是如何存储的? 3
2 构造函数与创建对象 5
2.1 什么是构造函数?(“特殊的”类方法) 5
2.2 对象的创建的全过程 5
2.3构造函数另类用法(使用类引用实现构造函数的多态性) 6
3 析构函数与销毁对象 7
3.1 什么是析构函数(“天生的”虚方法) 7
3.2 对象销毁的全过程 7
3.3 destroy, free, freeAndNil, release用法和区别 7
4 VCL构造&析构体系结构 8
5 正确使用构造函数和析构函数 9
剖析Delphi中的构造和析构
摘 要: 本文通过对VCL/RTL的研究,来剖析构造函数和析构函数的实现机制和VCL中对象的体系结构,并说明如何正确地创建和释放对象。
关键字: 构造,析构,创建对象,销毁对象,堆,栈,多态。
作 者: majorsoft
问题
Delphi中构造函数和析构函数的实现机制是什么?和C++有何不同?如何做到正确地创建和释放对象?
解决思路
如何正确使用构造和析构是我们在使用Delphi过程中经常遇到的问题,在大富翁论坛中的Oriented Pascal栏目有不少相关帖子(详见相关问题),本人也曾遇到过类似的问题,下面通过对VCL/RTL源代码的研究,来理解构造函数和析构函数的实现机制。
1 Delphi中的对象模型:
1.1 对象名表示什么?
与C++不同,Delphi中的对象名(也可以称做变量)表示对象的引用,并不表示对象本身,相当于指向对象的指针,这就所谓的“对象引用模型”。如图所示:
Obj(对象名) 实际的对象
Vmt 入口地址
数据成员
图1对象名引用内存中的对象
1.2 对象存储在哪里?
每个应用程序将分配给其运行的内存分为四个区域:
代码区(Code area)
全局数据区(data area)
堆区(heap area)
栈区(stack area)
图2 程序内存空间
代码区:存储程序中程序代码,包括所有的函数代码
全局数据区:存储全局数据。
堆区:又叫“自由存储区”,存储动态数据(在Delphi中包括对象和字符串)。作用域为整个应用程序的整个生命周期直到调用了析构方法。
栈区:又叫“自动存储区”存储程序中的局部数据,在C++中,局部变量实际上是auto类型的变量。作用域为函数内部,函数调用完系统就立即回收栈空间。
在C++中,对象既可创建在堆(heap)上,也可以创建在栈(stack)中,还可以在全局数据中创建对象,故C++有全局对象、局部对象、静态对象和堆对象四种对象之说。而在Delphi中,所有的对象都是建立堆(heap)存储区上,所以Delphi构造函数不能自动被调用,而必须由程序员自己调用(在设计器拖动组件,此时对象由Delphi创建)。下面的程序说明Delphi和C++中创建对象的区别:
在Delphi中:
Procedure CreateObject(var FooObjRef:TFooObject);
begin
FooObjRef:=TfooObject.create;
//由程序员调用,过程调用完之后,对象依然存在.不需要进行拷贝
FooObject.caption=’I am created in stack of CreateObject()’;
End;
而在C++中:
TfooObject CreateObject(void);
{
TfooObject FooObject;//创建局部对象
// static TfooObject FooObject;//创建静态局部对象
//对象自动调用默认的构造函数进行创建,对象此时在函数栈中创建
FooObject.caption=’I am created in stack of CreateObject()’;
return FooObject;
//返回的时候进行了对象拷贝,原来创建的对象随函数的调用结束后,自动销毁}
TfooObject fooObject2;//创建全局对象。
void main();
{ TFooObject* PfooObjec=new TfooObject;
//创建堆对象。函数调用完之后,对象依然存在,不需要进行拷贝。}
1.3 对象中存储了什么?它们是如何存储的?
与C++不同的是,Delphi中的对象只存储了数据成员和虚拟方法表(vmt)的入口地址,而没有存储方法,如图所示:
对 象 虚拟方法表 代码段
Vmt地址
name:String
width:integer;
ch1:char;
…
Proc1
Func1
…
procn
funcn
…
图 3 对象的结构 …
也许你对上面的说法存在着些疑问,请看下面的程序:
TsizeAlignTest=class
private
i:integer;
ch1,ch2:char;
j:integer;
public
procedure showMsg;
procedure virtMtd; virtual;
end;
memo1.Lines.Add(inttostr(sizeTest.InstanceSize)+':InstanceSize');
memo1.Lines.Add(inttostr(integer(sizeTest))+'<-start Addr');
memo1.Lines.Add(inttostr(integer(@(sizeTest.i)))+'<-sizeTest.i');
memo1.Lines.Add(inttostr(integer(@(sizeTest.ch1)))+'<-sizeTest.ch1');
memo1.Lines.Add(inttostr(integer(@(sizeTest.ch2)))+'<-sizeTest.ch2');
memo1.Lines.Add(inttostr(integer(@(sizeTest.j)))+'<-sizeTest.j');
结果显示:
16:InstanceSize
14630724<-start Addr
14630728<-sizeTest.i
14630732<-sizeTest.ch1
14630733<-sizeTest.ch2
14630736<-sizeTest.j
数据成员和vmt入口地址就占了16个字节!,两个成员函数showMsg, virtMtd在对象的存储区中根本没占空间。
那么成员函数到底存储在哪儿呢?由于Delphi是基于RTL(运行时类型库)的,所有的成员函数都在类中存储,成员函数实际上就是方法指针,它指向成员函数的入口地址,该类的所有对象共享这些成员函数。那么怎样找到成员函数的入口地址呢?对于静态函数,这个工作由编译器来完成的,在编译过程中,根据类对象引用/指针的类型,即直接在类来中找到成员函数的入口地址(此时并不需要对象存在),这也就是所谓的静态绑定;而对于虚方法(包括动态方法),则是通过在运行时的对象的虚拟方法表vmt入口地址(即对象的前四个字节,此时对象一定要存在,否则就会导致指针访问出错),来找到成员函数的入口地址,这也就是所谓的动态绑定。
注 意
上面提到,所有的成员函数都在类中存储,实际上也包括虚拟方法表Vmt。从Delphi的代码自动完成功能(它依赖于编译信息)可以看出,当我们在输入完对象名,再输入“.“之后,此时Delphi重新编译了一遍,列出所有的数据成员和所有的静态方法,所有的虚方法,所有的类方法,所有的构造函数和析构函数,大家可以动手试试看是不是这样的。
类虚方法表vmt入口地址
数据成员模板信息
静态方法表等
虚方法表vmt
对 象
Vmt入口地址
数据成员
上面的程序还演示了对象数据成员的对齐方式(物理数据结构),以4字节对齐(windows默认的对齐方式),如下图所示:
Vmt Entrance Addr
i
Ch1 Ch2
j
2 构造函数与创建对象
2.1 什么是构造函数?(“特殊的”类方法)
从OO(面向对象)思想的语义上讲,构造函数负责对象的创建,但就OOP语言的实现上讲,无论Delphi还是C++,构造函数充其量只做了对象的初始化工作(包含调用内部子对象的构造函数),并没有负责创建对象的全过程(参考2.2)。
另外,与C++中不同的是,Delphi为构造函数定义了另一种方法类型(mkConstructor,参见Delphi安装目录下的\Source\RTL\Common\typInfo.pas,125行),我们可以把它理解为 “特殊的”类方法。它只能通过类(类名/类引用/类指针)来调用,而一般的类方法既可以通过类也可以通过对象来调用;还有一点特殊就是构造函数中内置的self参数是指向对象的,而在类方法中self是指向类的,我们通常在其中对其数据成员进行初始化工作,使其成为真正意义上的对象,这都得益于self这个参数。
在默认情况下,构造函数是静态函数,我们可以把它设为虚方法,在其派生类中对其覆载(Override),这样可以实现构造函数的多态性(参见2.4),也可以对其进行重载(Overload),创建多个构造函数,还可以在派生类直接覆盖(Overlay)父类的构造函数,这样在派生类屏蔽了父类的构造函数,在VCL中就采用了这些技术,形成一个构造&析构的“体系结构”(参见4)
2.2 对象的创建的全过程
对象的创建完整过程应该包括分配空间、构造物理数据结构、初始化、内部子对象的创建。上面提到,构造函数只是负责初始化工作以及调用内部子对象的构造函数,那么分配空间和构造物理结构是怎么完成的呢?这由于编译器在做了额外的事情,我们不知道而已。编译到构造函数时,会构造函数之前,会在插入一行“call @ClassCreate”汇编代码,它实际上就是system 单元中的_ClassCreate函数,下面看看_ClassCreate函数的部分源码:
function _ClassCreate(AClass: TClass; Alloc: Boolean): TObject;
asm
{ -> EAX = pointer to VMT }
{ <- EAX = pointer to instance }
…
CALL dword ptr [EAX].vmtNewInstance //调用NewInstance
…
End; {\Source\RTL\sys\system.pas,第8939行}
VmtNewInstance=-12; 它是NewInstance 函数在类中的偏移量,则“CALL dword ptr [EAX].vmtNewInstance”实际上就是调用NewInstance,请看TObject.NewInstance:源码:
class function NewInstance: TObject; virtual;
class function TObject.NewInstance: TObject;
begin
Result := InitInstance(_GetMem(InstanceSize));
end;
“InitInstance(_GetMem(InstanceSize))”依次调用了三个函数:
1) 首先调用InstanceSize(),返回实际类的对象大小
class function TObject.InstanceSize: Longint; //相当于一个虚方法
begin
Result := PInteger(Integer(Self) + vmtInstanceSize)^;//返回实际类的对象大小
end;
2) 调用_GetMem()在堆上分配Instance大小的内存,并返回对象的引用
3) 调用InitInstance()进行构造物理数据结构,并把成员设置默认值,比如把整型的数据成员的值设为0,指针设为nil等。如果有虚方法,把虚拟方法表Vmt的入口地址赋给对象的前四个字节。
在调用完NewInstance之后,这个时候的对象,只有“空壳”,而没有实际的“内容”,所以就需要要调用定制的构造函数对对象进行有意义的初始化,以及调用内部子对象的构造函数,使程序中的对象能真实反映现实世界的对象。这就是对象创建的全过程。
2.3构造函数另类用法(使用类引用实现构造函数的多态性)
在Delphi中,类也是作为对象存储的,所以同样存在着多态性,它是借助类引用和虚类方法来实现的,这样提供了类一级的多态的实现。把类方法设为虚方法,在其派生类中覆载(override)它,再通过基类的引用/指针调用它,这样根据类引用/指针指向实际类来构造对象。请看下面的程序:
TmyClass=class
constructor create;virtual;
end;
Ttmyclass=class of TmyClass;//基类的类引用
TmyClassSub=class(TmyClass)
constructor create; override;
end;
procedure CreateObj(Aclass:TTMyClass;var Ref);
begin
Tobject(Ref):=Aclass.create;
//ref为无类型,和任何类型都不兼容,所以使用时必须显式强制转换(cast)
//Aclass为类引用,统一的函数接口,不同的实现。
//它会根据Aclass引用/指向的实际类来构造对象。
End;
…
CreateObj(TmyClass,Obj);
CreateObj(TmyClassSub,subObj);
3 析构函数与销毁对象
3.1 什么是析构函数(“天生的”虚方法)
从OOP思想的语义上讲,析构函数负责销毁对象,释放资源。在Delphi中,同义。
Delphi为析构函数也定义了一种方法类型(mkConstructor,参见Delphi安装目录下的\Source\RTL\Common\typInfo.pas,125行),在VCL中,它实际是一种“天生的”虚方法,在VCL类所有的祖先-Tobject中定义了“destructor Destroy; virtual; ”。为什么VCL要这么做呢?因为它要保证在多态情况下对象能正确地被析构。如果不使用虚方法,则可能只析构了基类子对象,从而造成所谓的“内存泄露”。所以为了保证正确地析构对象,析构函数都需要加override声明。
3.2 对象销毁的全过程
先销毁派生类子对象,再销毁基类子对象。
提 示
在派生类中,基类子对象指从基类中继承的部分,派生类中子对象是指新增的部分。
3.3 destroy, free, freeAndNil, release用法和区别
destroy:虚方法
释放内存,在Tobject中声明为virtual,通常是在其子类中override 它,且要加上inherited关键字,才能保证派生类对象正确地被销毁;
但destroy一般不能直接用,为什么?
假如当一个对象为nil,我们仍然调用destroy,此时会产生错误。因为destroy是虚方法,它要根据对象中的头四个字节找到虚拟方法表Vmt的入口地址,从而找到destroy的入口地址,所以此时对象一定要存在。但free就是静态方法,它只需根据对象引用/指针的类型来确定,即使对象本身不存在也没问题,而且在free中有判断对象是否存在的操作, 所以用free比用destroy安全。
2)free:静态方法
测试对象是否为nil, 非nil则调用destroy。下面是free的Delphi代码:
procedure Tobject.Free;
begin
if Self <> nil then
Destroy;
end;
一静一动,取长补短,岂不妙哉!
不过,调用Destroy只是把对象销毁了,但并没有把对象的引用设为nil,这需要程序员来完成,不过自从Delphi5之后,在sysUtils单元中提供了一个freeAndNil。
3)freeAndNil;一般方法,非对象方法,非类方法。
SysUtils单元中FreeAndNil 定义
procedure FreeAndNil(var Obj);
var
Temp: TObject;
begin
Temp := TObject(Obj);
Pointer(Obj) := nil;
Temp.Free;
end;
建议大家用它代替free/Destroy,以便确保正确地释放对象。
4)release;TcustomForm中定义的静态方法。
当窗口中所有的事件处理完之后,才调用free函数。常用在销毁窗口,而在这个窗口中事件处理需要一定的时间的时候,用这个方法能确保窗口事件处理完之后才销毁窗口。下面是TCustomForm.Release的Delphi源代码:
procedure TCustomForm.Release;
begin
PostMessage(Handle, CM_RELEASE, 0, 0);
//向窗口发CM_RELEASE消息到消息队列,当所有的窗口事件消息处理完之后,
//再调用CM_RELEASE消息处理过程CMRelease
end;
再看看下面CM_RELEASE消息处理过程CMRelease的定义:
procedure CMRelease(var Message: TMessage); message CM_RELEASE;
procedure TCustomForm.CMRelease;
begin
Free; //最后还是free;
end;
4 VCL构造&析构体系结构
TObject
constructor Create;//静态方法
destructor Destroy; virtual;
TPersistent
destructor Destroy; override;
TComponent
constructor Create(AOwner: TComponent); virtual;
destructor Destroy; override;
TControl
constructor Create(AOwner: TComponent); override;
destructor Destroy; override;
…
下面分析VCL中的构造和析构的源代码,以Tcontrol为例:
constructor TControl.Create(AOwner: TComponent);
begin
inherited Create(AOwner);//创建基类子对象,并把析构权移交给AOwner。放在最前面
//这样就保证了“先创建基类子对象,再创建派生类子对象”的顺序
…//初始化,以及调用内部子对象的构造函数
end;
destructor TControl.Destroy;
begin
…//析构派生类中内部子对象
inherited Destroy;//析构基类对象,放在最后面
//这样就保证了“先析构派生类子对象,再析构基类子对象”的顺序
end;
5 正确使用构造函数和析构函数
经过上面的分析,下面总结一下使用构造函数和析构函数的原则:
在使用对象之前,必须先建立一个对象时,并且及时销毁对象,以释放资源。
两个对象引用赋值时,要确保出现的无名对象(指没有被引用的对象)能被释放。
当创建一个组件时,建议设置一个宿主组件(即使用AOwner参数,通常是窗体),由Aowner来管理对象的销毁,那么就不必惦记着销毁该组件了,这是Delphi在窗体上/数据模块设计并创建组件是采用的方法。所以我们不必书写调用该组件的析构函数。
当函数的返回类型为对象时,那么Result也是对象的引用,确保Result引用的对象要存在。
若要使用obj<>nil 或assigned(nil)测试对象存在时,在调用析构之后还应obj:=nil。
请参考演示程序的源代码
说明(建议要有)
所有的Delphi程序已在win2k+Delphi6 sp2 上通过,对于C++程序,只是为了说明与Delphi中不同,并不保证能直接运行。为了加深对本篇文章的理解,建议参考演示程序。
这篇文章包括了我在学习VCL/RTL中的一些经验和体会,加上本人的个人能力有限,难免出现错误,请大家不吝指正!
在阅读本篇文章之前,需要读者对Oriented Pascal语言有一定的了解,并能理解多态,如果您对其中一些概念还不是很清楚的话,请参考相关文章。
通过本篇文章,你应该能比较清楚地理解Delphi中的对象模型、构造&析构实现机制以及VCL中构造&析构 体系结构,并能掌握使用构造&析构的使用方法。Delphi中的构造&析构相当于C++中的算是简单多了,我们应该能掌握它。