Pure C++ 专栏...
翻译:coffer
欢迎来到我在MSDN杂志主持的第一个专栏!实际上,我以前写过第一个专栏,其内容完全不同——讲的是Visual Studio 2005中新的泛型编程支持。但回想起来,我 觉得那篇文章留下了太多的未解答问题。因此我另辟蹊径开设这个专栏,以便提供一个我的团队在开发 Visual C++ 2005 中的 C++/CLI 方面的概观。由此我还将写一些有关.NET泛型编程的专栏。不要忘了本专栏是基于预览版的,因此有些内容可能会改变。
什么是C++/CLI?
C++/CLI描绘的是一种多元组合,此处的 C++ 当然是指 Bjarne Stroustrup 在 Bell 实验室发明的C++编程语言。它支持速度和执行 文件的大小都得到优化的静态对象模型。但除了堆内存分配以外,它不支持运行时程序对对象的更改。它允许对底层机器进行无限制的访问,但对于正在运行的程序中的活动类型、以及相关的程序基础构造,它的访问能力却非常有限、或者根本就不可能。我在微软的同事 Herb Sutter,也是C++/CLI的主架构师,认为C++是一个混凝土语言。
“CLI”即公共语言基础结构(Common Language Infrastructure),这是一个支持动态组件编程模型的多层架构。在许多方面,它所表示的对象模型和C++的完全相反。它是一个运行时软件层 ,一个虚拟执行系统,运行在应用程序和底层操作系统之间。对底层机器的访问受到相当严格的限制。支持对运行中程序的活动类型以及关联程序的基础构造 进行存取——发现和建构。斜线“/”表示 C++ 和 CLI 之间的一种绑定(binding),有关这种绑定的细节构成本专栏的常规主题。
所以,对于“什么是C++/CLI?”这个问题第一个最近似的答案是:它是静态C++对象模型到动态CLI组件对象模型的一种绑定, 简言之,它就是你如何用C++进行.NET编程,而不是用C#或Visual Basic.NET。象C#和CLI自己一样,C++/CLI正在经历 ECMA(欧洲计算机制造商协会) 标准化并最终要经历ISO标准认证。
公共语言运行时(CLR)是微软版的CLI,专门用于 Windows 操作系统,同样,Visual C++ 2005是C++/CLI 的实现。
第二个近似答案是:我觉得C++/CLI在C++内集成.NET编程模型与以前贝尔实验室在当时的C++中用模板集成泛型编程一样有异曲同工之处。两种情况中,你在现有C++代码库上的投资以及你现有的C++专业技术都得到保护。这是C++/CLI设计的一个基本 要求。
学习C++/CLI
一种C++/CLI语言的设计有三个层面,这三个层面也适用于所有语言:语言层语法到公共类型系统(CTS) 的映射;选择为程序员直接操作而公开的底层CLI基本组织结构 的详细程度;以及选择要提供的超越CLI直接支持的附加功能。
第一个层面是所有CLI语言在很大程度上都共有的,第二个层面和第三层面是某一CLI语言区别于其它语言的地方。根据所要解决的问题,你可以选择某一 种语言,也可以将多种CLI语言结合起来。学习C++/CLI语言需要掌握这三个设计层面。
怎样将C++/CLI 映射到CTS?
了解底层CTS 对学习C++/CLI非常有帮助,它主要包括三个常规类类型:
多态引用类型,其用于所有的类继承; 非多态值类型,其用于实现需要运行时效率的具体类型,如数字类型; 抽象接口类型,其用于定义一个实现该接口的一组引用类型或值类型共同使用的公共操作集; 在设计方面,虽然CTS到一组内置的语言类型的映射对于所有CLI语言来说都是共同的,当然,每一种CLI语言的语法各不相同。例如,在C#中,我们可以 这样来定义一个抽象基类 Shape,从这个类派生特定的几何模型对象。
abstract class Shape { ... } // C#
而在C++/CLI中,可以象下面这样写,以表示完全相同的底层引用类型:
ref class Shape abstract { ... }; // C++/CLI
在底层 IL(中间语言)中,以上两种声明以完全相同的方式表示。同样,在C#中,我们可以用下面的代码来定义一个具体的 Point2D 类 :
struct Point2D { ... } // C#
而在C++/CLI中写成:
value class Point2D { ... }; // C++/CLI
借助 C++/CLI 支持的类类型家族表现了一种本机方式的 CTS 集成。它确定了你的语法选择,例如:
class native {};
value class V {};
ref class R {};
interface class I {};
CTS 也支持枚举类类型,其行为方式与本机枚举稍微有些区别,C++/CLI对二者都提供支持:
enum native { fail, pass };
enum class CLIEnum : char { fail, pass};
同样,CTS支持其自己的数组类型,其行为也与本机数组类型有一定差别,微软同样对二者提供支持:
int native[] = { 1,1,2,3,5,8 };
array<int>^ managed = { 1,1,2,3,5,8 };
那种认为任何一种 CLI 语言比另一种语言更接近或几乎就是到底层CLI的映射是不精确的。相反,每一种CLI语言都只是表达了自己对底层CLI对象模型的一种 见解。在下一节你将更清楚地看到这一点。
CLI 的细节标准
在设计CLI语言时必须考虑的第二个设计层面是要将什么程度的底层CLI实现模型结合到该语言中。这个语言解决什么样的问题?要解决这些问题必须要什么样的工具? 此外,该语言很可能吸引哪一类程序员?
下面,我们利用发生在托管堆中的值类型问题。在许多情况下,值类型可以在托管堆中找到自己:
通过隐式的框入/框出操作(boxing)——当值类型的某个实例被赋值给一对象时,或者通过某个未被改写的值类型调用一个虚拟方法时; 当值类型被当作为引用类类型的成员时; 当值类型被当作CLI数组元素存储时; 是否允许程序员处理这种值类型地址是设计CLI语言时必须要解决的问题。
存在的问题?
位于托管堆中的任何对象在垃圾回收器进行清扫收缩的过程中都有可能遭遇重新分配,指向这些对象的任何指针必须被追踪并在运行时得到更新,而程序员 无法自己手动追踪它们,因此,如果你被允许用某个可能在托管堆中的值类型的地址,那么除了本机指针外,还需要一个追踪形态的指针。
到底该怎样去权衡呢?一方面,需要考虑简洁和安全。直接引入对一个或一组追踪指针的支持会使语言变得更复杂。如果不提供这种支持,由于所需的复杂程度降低,从而可以找到的程序员人群就会增加。此外,允许程序员访问这些生命期短暂的值类型,则增加了程序员出错的可能性。她经意或不经意地对内存做一些危险动作。不支持追踪指针,可以潜在地创建较安全的运行时环境。
另一方面,必须考虑效率和灵活性。每次将值类型赋值给相同的对象,该值都会发生新的框入/框出操作。允许访问这种经过框入/框出操作的值类型 ,就允许在内存中进行更新操作,这样便可能提供重要的性能改进。没有某种形式的追踪指针,你将无法用指针算法遍历CLI数组,这意味着CLI数组将不能 融入STL(标准模板库)中的迭代器模式,也无法与泛型算法协同工作。允许访问框入/框出值类型将会大大提高设计的灵活性。
在C++/CLI 中,微软选择提供一系列在托管堆中处理值类型的寻址模式:
int ival = 1024;
int^ boxedi = ival;
array<int>^ ia = gcnew array<int>{1,1,2,3,5,8};
interior_ptr<int> begin = &ia[0];
value struct smallInt { int m_ival; ... } si;
pin_ptr<int> ppi = &si.m_ival;
典型的 C++/CLI 开发人员是一个经验丰富的系统程序员,其任务是提供底层架构以及作为基础的核心应用,以此为基础来构建未来。她必须解决可伸缩性和性能相关的问题,并且必须从系统一级来看待底层 CLI。某种 CLI 语言的细节标准反映了其程序员的面貌。
复杂性本身并不是对质量的否定,人类生命比单核细胞复杂得多,这当然不是一件坏事,然而,当单一概念的表达变得复杂化以后,这常常被认为是一件坏事。在C++/CLI中,CLI开发团队已经 尝试提供一种优雅的方式来表达一个复杂的主体。
附加功能
第三个设计层面是特定语言层功能要超过被CLI直接支持的功能,这样就需要建立一种语言层支持与CLI底层实现模型之间的映射。 在某些情况下,这是做不到的,因为该语言无法调解CLI的行为,在基类的构造函数和析构函数中解决虚函数便是例子。为了在这种情况中反映ISO-C++语义,需要在每个基类的构造函数和析构函数中 重新安排虚表。这是不可能的,因为虚表操作是由运行时托管的,而非单独的语言托管。
因此,这一设计层面是优越性和可行性的折中。C++/CLI 提供的附加功能主要有三个方面:
引用类型的资源获取(Resource Acquisition)形式是Initialization(RAII), 尤其是为被称作占据稀有资源的垃圾回收类型确定性终止化(deterministic finalization)提供一个自动化的机制; 与C++拷贝构造函数和拷贝赋值操作符相关的深度拷贝语义形式,但它不能扩展到值类型; 除了 CLI泛型机制之外——这原来是我第一个专栏的主题,还为CTS类型提供C++模板的直接支持,另外,还提供用于 CLI 类型的 STL 可验证版本; 让我们看一个简单的例子:确定性终止化问题。与对象关联的内存被垃圾回收器回收之前,若存在与之相关连的 Finalize 方法,该方法将会被调用。你可以把 该方法看作是一种超级析构函数,因为它不依赖于该对象程序的生命期,它被称为终止化。调用 Finalize 方法的时间,甚至是否调用它是未定义的。这就是垃圾回收器不确定的终止化操作含义之所在。
不确定性终止化在进行动态内存管理时可以很有效地工作,当可用内存空间严重不足时,垃圾回收器会发挥作用并解决问题。但是当对象涉及的是某些重要资源,比如数据库连接、某种 类型的锁、本地堆内存时,不确定性终止化的表现却不尽人意。在这种情况下,最好是尽快释放不再需要的资源。目前CLI采用的解决办法是:某个类在其 IDisposable 接口的 Dispose 方法中释放资源,这里的问题是 Dispose 需要显式调用,因此它不可能被执行。
C++的基本设计模式是前述的资源获取(Resource Acquisition )即初始化(Initialization),它意味着类通过构造函数 获取资源,相反,通过析构函数来释放资源。在类对象的生存期内是自动管理的。
以下是引用类型释放资源的过程:
用析构函数压缩在释放资源过程中必须的代码; 自动调用绑定到类对象生存期的析构函数; CLI中,引用类型的类没有类析构的概念,因此,析构函数被映射到底层实现中另外的东西上,编译器则在内部完成如下转换: 类具备其基类列表,从接口 IDisposable 延伸继承; 析构函数被转换成IDisposable 的 Dispose 方法; 这仅仅完成了一半,还需要一种析构函数的自动调用途径。支持引用类型专用的基于堆栈的符号,也就是说其生命期与其声明的范围相关联。编译器 在内部转换符号,在托管堆中分配引用对象。随着范围的终止,编译器插入一个对 Dispose 方法的调用——用户定义的析构函数。与该对象关联的实际内存的回收仍然在垃圾回收器的掌控之下。例如如 Figure 1 所示。
C++/CLI 不仅仅是C++到管理世界的扩展,相反,它 表现了一种完全的编程范例,类似于早期多重继承和泛型编程范例集成到该语言一样,我认为这个团队完成了一项杰出的工作。
那么,你是如何看待 C++/CLI 的呢?
C++/CLI代表了本地和托管编程的综合,在这个反复过程中,这种综合通过即独立而又等同的源码级和二进制元素共同体来完成,包括混合模式( 本机和CTS类型的源码级混合,以及本机和CIL对象文件的二进制混合),地类型和CTS类型的混合,新增了混合本地对象和CIL对象的二进制文件),纯模式( 本机和CTS类型的源码级混合,所有编译过的 CIL 对象文件),本机类(仅通过专门的包装类才可以操控 CTS 类型),以及 CTS 类(只能以指针形式操控本机类型)。
当然,C++/CLI 程序员也可以选择单独用 CLI 类型来编程,在这种方式中提供能被寄宿的可验证代码,比如 SQL Server 2005 中的存储过程。
现在,回到什么是 C++/CLI 的问题,它是进入.NET编程模型的第一道门槛,有了 C++/CLI,你不仅具备了迁移 C++ 源代码库的途径,同时还可以迁移 C++ 专业技术。这让我感觉非常惬意。
问题和建议请发送到 purecpp@microsoft.com.
作者简介Stanley B. Lippman 是 Microsoft 公司 Visual C++ 团队的架构师。从 1984 年开始他便在 Bell 实验室与 C++ 的发明者 Bjarne Stroustrup 一起研究 C++。在此期间,他在 Disney 和 DreamWorks 制作特色动画,同时他还是 JPL 的高级顾问以及 Fantasia 2000 的软件技术主管。
本文出自 MSDN Magazine 的 February 2005 期刊,可通过当地报摊获得,或者最好是 订阅
本文由 VCKBASE MTT团队 翻译