天方夜谭VCL: 生死虫虫
生命是什么?科学和宗教都给出了不同的诠释。有句话也许说得更有意思:生命是这样一种东西,如果你把它当作一个开场或结局,那么它总是一样的;而当你把它当作一个过程,它总是不同的。其实,万事万物又何尝不是分别以生和死作为开场和结局呢?对象也不例外,不过生成以及销毁对象都需要健全的机制作保证。否则不仅对象本身遭殃,甚至会导致程序乃至整个系统崩溃。
传说中,东方的天、人、阿修罗、畜生、饿鬼、地狱六道轮回(以及由此演变出的丰都鬼城),和西方的地狱、炼狱、天堂,都有一套非常完整、严密、健全的机制,管理着时空中各种生命体。同样,一套框架也需要这么一套机制来管理记忆体中的对象,以保证正常运作。VCL自然也不例外。但虫虫这次并不准备详细分析涉及VCL对象生死的代码,相信大家对剖析涉及底层汇编都有了一定的经验。所以前面虫虫会对这方面提几句,把重点放在设计的结构和模式上,并解决一个在BBS上看到的问题。
对象生成
对象生成的方式几乎都是一样,一般流程如右图所示(VCL类的初始化是指初始化VMT和接口指针)。对象一般生存在两个地方,栈(stack)或自由存储区(free store)[1]中。由于Object Pascal只支持第二种方式,所以VCL类都在自由存储区中,表现在C++中就是必须使用new和delete分配、回收空间,速度自然会比存在于栈中的普通C++类要慢一些。
控制VCL对象生成过程的代码主要在TObject::InstanceSize、TObject::NewInstance、TObject::InitInstance几个成员函数中。有兴趣的朋友可对照右图分析一下,源代码在Source/Vcl/system.pas里,没有什么特别之处。我们将把重点主要放在分析动态生成(Dynamic Creation)机制上。
动态生成是一个相当实用的技术。比如上次我们提到的一个绘制图形的程序[2],具体的图形以插件的方式提供,主程序对相应的图形类一无所知,但是仍然需要“动态”地生成这些对象。又比如Delphi/C++ Builder的IDE对象设计器,也是一个很好的例子:鼠标双击,一个对象就动态生成在设计面板,可以供我们设计之用了。C++语言本身并没有也不可能提供对动态生成的支持,不过MFC中用宏(macro)模拟就可以取得令人满意的效果[3]。
图1对象生成流程
仔细想来,动态生成是个很好笑的技术,它需要程序生成一个对其性质并不清楚的对象。您能造一个您不知道的东西吗?不可能。但是如果告诉您制造的原料和方法呢?那当然就很简单了。所以动态生成的关键是:留好事先约定的接口。MFC的宏模拟就是一种方式,Object Pascal则是使用了另一种方式。
“高级”RTTI方式往往会引入一个所谓“类的类”,即“元类(metaclass)”的概念[4]。在Object Pascal中,每个类都有一个代表其相应信息的类。代表TObject类信息的类是TClass,代表TPersistent类信息的类就是TPersistentClass……
图2实现RTTI的metaclass
Object Pascal可以借此来实现对TComponent派生类的“动态生成(Dynamic Creation)”机制。 function CreateComponent(AOwner: TComponent;AClass: TComponentClass)
:TComponent;
var
Instance: TComponent;
begin
Instance := TComponent(AClass.NewInstance);
{try}
Instance.Create(Owner);
{except
raise;
end;}
CreateComponent := Instance;
end;
但是在C++ Builder中,这一切就无效了。对于所谓的“元类”,C++ Builder的VCL中只提供TMetaClass类,并且功能很少,甚至根本没有提供NewInstance等方法,巧妇难为无米之炊啊。Borland怎么这么偏心眼呢?又怎么办呢?国内各大BBS上,我问过,也看别人问过这样的问题,可以总是没有答案。在国外的BBS上这样的问题也不少,而常见的解决方案(是,用Object Pascal写单元,再让C++调用,这也未免……
动态生成的难点
TMetaClass究竟是什么?我们已经知道,就是指向VMT入口的指针。假如给我们一个TMetaClass,我们能做到动态生成吗?对照对象生成的流程图,我们来分析
获取类实体大小:通过TMetaClass::InstanceSize可以做到;
分配空间:这个当然可以;
初始化:如果无特殊需要,直接调用TObject::NewInstance就行了。老弟,不是开玩笑吧?TObject::NewInstance是private!呵呵,想个办法绕过去,通过VMT表“开门”不就OK?)
调用构造函数:倒!这个怎么办?TMetaClass里可没记录过某个类的构造函数,再说,一个类的构造函数好象也不只一个吧?
唯一的问题,就出在构造函数上:我们需要一个形式固定的“虚”构造函数,也就是我们刚才说的:留好实现约定的接口。这一招的要点,跟MFC是一致的。
虚构造函数?C++的构造函数可以是虚(virtual)的吗?当然不可以。VCL类从TComponent类开始,构造函数就是虚的(难怪刚才我们只生成TComponent的派生类),Object Pascal所谓的虚构造是如何做到的呢?Scott Meyers在Virtualizing constructors and non-member functions一文[5]中详细说明了所谓虚构造的实现方式:事先约定一个普通的虚函数,其功能是构造函数而已。也就是说,Object Pascal所谓的虚构造函数(名字是Create),不过是一个事先约定好功能的普通虚成员函数罢了。MFC是这么做的,事实上,VCL也一定差不多。在设计模式中,这叫做FACTORY METHOD模式,正好又名VIRTUAL CONSTRUCTOR模式[6]。
那么,这个虚函数一定可以在VMT中找出来!问题不就解决了吗?在TComponent类的VMT入口开始的若干个指针地址中找出TComponent::TComponent(也就是Object Pascal中的TComponent.Create),相信是很容易的事情吧? #include
#include
using namespace std;
void main()
{
void** p = (void**)__classid(TComponent);
for(int i = 0; i < 15; ++i)
cout << *(p++) << '\t';
}
这几行程序能输出TComponent的VMT中前15个函数地址。在我的机器上输出结果是(也许在您那里有所不同): 40026BD440030A5440026AF040030B2C400309F8
40030B3840030C3040030F8840030B4840030B40
40030F90400306CC0000000E0001000045840000
再查查TComponent::TComponent的地址。IDE菜单View->Debug Windows->Modules,选择vcl50.bpl,找到TComponent::TComponent(如下图)。看到了吧?它的地址跟上面输出的第12个地址完全相同,这,就是我们的目标!(其实我们还有更偷懒的方法:看看前面那段Object Pascal程序的汇编代码就行啦!)
图3寻找TComponent::TComponent的地址
现在写个我们自己的CreateComponent很容易了吧?从VMT入口算,第12个指针是构造函数的指针。而VCL类是“虚”构造的,所有TComponent的派生类的构造函数地址也会放在那里。所以,从VMT第一个指针往前数11个,就是我们需要的第12个指针了。 TComponent* CreateComponent(TComponent* AOwner, TClass cls)
{
TComponent* r;
const void* const fn = *(void**)((char*)cls + vmtNewInstance),
* const fc = *((void**)cls + 11);
//fn是NewInstance的地址,
//fc则是构造函数的地址,从第一个往后数11个,即第12个
//下面为了偷懒,用几句汇编
asm{
mov eax, cls
call fn//调用NewInstance,执行图1流程前3步
mov r, eax
mov edx, AOwner
call fc//调用构造函数
}
return r;
}
我们不妨测试一下。 #pragma inline
#include
#include
using namespace std;
class TTestButton: public TButton
{
public:
__fastcall TTestButton(TComponent* Owner): TButton(Owner)
{
cout << "Hello!" << endl;
}
__fastcall ~TTestButton()
{
cout << "Goodbye!" << endl;
}
};
TComponent* CreateComponent(TComponent* AOwner, TClass cls)
{
//...
}
void main()
{
TComponent* p = CreateComponent(0, __classid(TTestButton));
cout << AnsiString(p->ClassName()).c_str() << endl;
delete p;
}
输出: Hello!
TTestButton
Goodbye!
结果令人满意!
属主机制
这里简单提一下VCL类的组织形式:属主(Owner)机制。
从TComponent开始,VCL类的构造函数就带有一个TComponent*类型(Object Pascal中表现为TComponent)的参数AOwner。每个从TComponent继承的类的实体都拥有唯一一个所有者(Owner,亦即属主),这就决定了这些类之间是树形关系。例如 TForm* Form1 = new TForm(Application);
TForm* Form2 = new TForm(Application);
TButton* Button1 = new TButton(TForm1);
图4树形结构
这样就形成了如下以Application为根(Root)的树形结构:
上图中的箭头表示从属关系,也就是下图的意思
图5 从属关系
于是当Application析构的时候,它会通知自己所拥有的对象Form1和Form2析构,Form1和Form2再通知自身所拥有的对象析构,如此递归下去,正如同推倒了多米诺骨牌(Domino):Form1和Form2以及它们所拥有的对象,不用显式调用析构函数,资源就自动回收了。
这种Owner机制就是设计模式中典型的结构型模式COMPOSITE(组合)[6],即某个对象拥有一系列类似的对象,而这一系列对象中的每一个又拥有一系列的对象,如此递归下去,管理起来很方便。由Application向其所拥有的对象发送析构的消息的方式,是典型的行为模式Observer(观察者),这也是VCL消息处理的基本模型,我们以后会详细讨论这一问题。
小结
本来开始想对对于VCL类实体具体的生成和销毁做汇编级的分析,后来发现没有多少新的东西,就留给有兴趣的朋友钻研吧。我不得不承认,这篇文章的“黑客”气太重了点儿,扩充性并不好。下次我们将逐步进入VCL消息处理机制,看看它的精华部分。
参考
1. Herb Sutter. Exceptional C++. Addison-Wesley, Reading, MA. 1999.
侯捷.《Exceptional C++中文版》.培生教育出版集团.2000.
2. 虫虫.《天方夜谭VCL:多态》.C++ View.2001,10.
3. 侯捷.《深入浅出MFC》,2/e.松岗电脑图资料股份有限公司/华中科技大学出版社.1997/2001.
4. 虫虫.《天方夜谭VCL:开门》.C++ View.2001,9.
5. Scott Meyers. More Effective C++. Addison-Wesley, Reading, MA. 1996.
侯捷.《More Effective C++中文版》.培生教育出版集团.2000.
6. GoF. Design Patterns: Elements of Resuable Object-Oriented Software. Addison-Wesley, Reading, MA. 1995.
李英军等.《设计模式:可复用面向对象软件软件的基础》.机械工业出版社.2000.