理解.NET中的CLR原理
作者:yarshray saga join(如要转载请附上作者,谢谢!)
首先本文是的目的是要让大家明白,CLR在。NET中的作用是十分重要的,如果要完全掌握。NET那么理解CLR运行原理就是必然的事情。比如,你想在程序中实现动态获取程序集信息,动态创建,后期绑定,反射等特性,那么正确的理解CLR的原理就显得格外的重要。
下面让我来做一个整体的介绍,来帮助你来了解CLR中的一些另人激动的特性。理解这些特性将更好的帮助你来理解CLR。
*与本机代码无关 ——— MSIL (中间语言)
*让我们使用同一种语言 ——— CLR (公共语言运行时)
*我们手中的零件 ——— Assembly (装配件)
*让我们在同一个系统中运行 ——— CTS (通用类型系统)
*宇宙大爆炸后的产物 ——— metadata (元数据)
*让我们的语言可以交流 ——— CLS (公共语言系统)
*在动态中交互 ——— Reflection (反射)
*属于我们自己的空间 ——— NameSpace (名称空间)
本文的目的力求做到精简,要精简,就不得不省去细节,但为了全面和完整我会在文中放连接,那样,可以让读者对自己感兴趣或希望有更多了解的地方进行深入的了解。(注:连接有部分为MSDN中内容,因此你必须要安装。NET 的合并MSDN才可查看。)
词汇:
由于我想简写,因此会直接采用原词。但为了帮助理解,我在这里给出翻译:
MSIL:微软中间语言
Reflection:反射
Metadata:元数据
PE:可执行可移植文件
Assembly: 程序集(装配件)
NameSpace:名称空间
CTS:通用类型系统
GC(Garbage Colection) :无用单元回收
CLR:公共语言系统
Attribute:属性(注意不要和Property混淆)
Boxing: 装箱
UnBoxing: 拆箱
正文:下面让我们进入整文
*与本机代码无关 ——— MSIL (中间语言)
1.谈谈MSIL
图例:
平台无关本机代码
MSIL
使用。NET支持的语言所编写的代码
JIT
编译
MSIL(Microsoft Intermediate Language)微软的中间语言。和JAVA的虚拟机类似,是与CPU无关的指令集。当编译为托管代码时,编译器将源代码翻译为MSIL,
如上图所示。MSIL 包括用于加载、存储和初始化对象以及对对象调用方法的指令,还包括用于算术和逻辑运算、控制流、直接内存访问、异常处理和其他操作的指令。在可以执行代码前,必须将 MSIL 转换为 CPU 特定的代码,这通常是通过实时 (JIT) 编译器完成的。由于公共语言运行库为它支持的每种计算机结构都提供了一种或多种 JIT 编译器,因此可以在任何受支持的结构上对同一组 MSIL 进行 JIT 编译和执行。这样总结上面的就是:中间语言是一组独立于CPU的指令集,它可以被即时编译器Jitter翻译成目标平台的本地代码。
2.谈谈PE
Windows PE和一个 .NET PE的主要区别在于Windows PE 是由操作系统执行的,而.NET PE 却被转变成为.NET Framework的CLR. 识别一个PE是 .NET还是Windows取决于他的通用的目标文件格式 (COFF) 是否使用Windows的操作系统. 目标文件格式 (COFF) 指定了任何文件都分成两个部分:文件数据本身以及描述文件内包含的数据内容的头文件串。
MSIL 汇编程序从 MSIL 汇编语言生成可移植可执行的 (PE) 文件。可以运行结果可执行文件(该文件包含 MSIL 和所需的元数据)以确定 MSIL 是否按预期执行。这就是我为什么会谈到PE。
。NET中的PE参考:
http://www.csdn.net/Develop/article/13%5C13683.shtm
。NET中的PE
.NET PE File Format
l COFF and PE Headers
l Code and Data Sections
l Metadata Tables and IL Organization
l Java Class File Format vs. .NET PE File For
那么PE文件是怎么执行的呢?下面是一个典型的.NET应用程序的执行过程:
用户执行编译器输出的应用程序(PE文件),操作系统载入PE文件,以及其他的DLL(.NET动态连接库)。
操作系统装载器根据PE文件中的可执行文件头跳转到程序的入口点。显然,操作系统并不能执行中间语言,该入口点也被设计为跳转到mscoree.dll(.NET平台的核心支持DLL)的_ CorExeMain()函数入口。
CorExeMain()函数开始执行PE文件中的中间语言代码。这里的执行的意思是CRL(通用语言运行时)按照调用的对象方法为单位,用JIT(即时编译器)将中间语言编译成本地机二进制代码,执行并根据需要存于机器缓存。
程序的执行过程中,GC(垃圾收集器)负责内存的分配,释放等管理功能。
程序执行完毕,操作系统卸载应用程序。
3. 工具参考:
MSIL 反汇编程序是 MSIL 汇编程序 (Ilasm.exe) 的伙伴工具。Ildasm.exe 采用包含 Microsoft 中间语言 (MSIL) 代码的可移植可执行 (PE) 文件,并创建相应的文本文件作为 Ilasm.exe 的输入。
ms-help://MS.VSCC/MS.MSDNVS.2052/cptools/html/cpconmsildisassemblerildasmexe.htm
*让我们使用同一种语言 ——— CLR (公共语言运行时)
1.CLR的特性:
1.跨语言应用
当编程人员在用自己喜欢的编程语言写源代码的时候, 这个源代码在被转化成媒介语言(IL)之前,先被编译成了一个独立的可执行单元(PE)。这样无论
你是一个VB。NET程序员,或一个C#程序员,甚至是使用托管的C++的程序员。只要被编译成IL就是同等的。
首先,编译输出的exe是一个由中间语言(IL),元数据(Metadata)和一个额外的被编译器添加的目标平台的标准可执行文件头(比如Win32平台就是加了一个标准Win32可执行文件头)组成的PE(portable executable,可移植执行体)文件,而不是传统的二进制可执行文件--虽然他们有着相同的扩展名。中间语言是一组独立于CPU的指令集,它可以被即时编译器Jitter翻译成目标平台的本地代码。中间语言代码使得所有Microsoft.NET平台的高级语言C#,VB.NET,VC.NET等得以平台独立,以及语言之间实现互操作。元数据是一个内嵌于PE文件的表的集合。
2.安全性
。NET提供了一组安全方案。负责进行代码的访问安全性检查。允许我们对保护资源和操作的访问。代码需要经过身份确认和出处鉴别后才能得到不同程度的信任。安全策略是一组可配置的规则,公共语言运行库在决定允许代码执行的操作时遵循此规则。安全策略由管理员设置,并由运行库强制。运行库确保代码只能访问安全策略允许的资源和调用安全策略允许的代码。
每当发生加载程序集的尝试时,运行库就使用安全策略确定授予程序集的权限。在检查了描述程序集标识的信息(称为证据)后,运行库使用安全策略决定代码的信任程度和由此授予程序集的权限。证据包括但不仅限于代码的出版商、它的站点以及它的区域。安全策略还确定授予应用程序域的权限。
安全性参考:
ms-help://MS.VSCC/MS.MSDNVS.2052/cpguide/html/cpconkeyconceptsinsecurity.htm
3.版本化和程序
由于使用了元数据,所以你可以使用XCOPY简单的复制就可以了,而CLR也可以在运行时期读取元数据,以确保多版本程序运行在同一进程中。使用公共语言运行库的程序集的所有版本控制都在程序集级别上进行。一个程序集的特定版本和依赖程序集的版本在该程序集的清单中记录下来。除非被配置文件(应用程序配置文件、发行者策略文件和计算机的管理员配置文件)中的显式版本策略重写,否则运行库的默认版本策略是,应用程序只与它们生成和测试时所用的程序集版本一起运行。
参考程序集版本控制:
ms-help://MS.VSCC/MS.MSDNVS.2052/cpguide/html/cpconassemblyversioning.htm
4.调用和配置
当运行库试图解析对另一个程序集的引用时,就开始进行定位并绑定到程序集的进程。该引用可以是静态的,也可以是动态的。在生成时,编译器在程序集清单的元数据中记录静态引用。动态引用是由于调用各种方法而动态构造的,例如 System.Reflection.Assembly.Load 方法。
引用程序集的首选方式就是使用完全引用,包括程序集名称、版本、区域性和公钥标记(如果存在)。运行库就会使用这些信息来定位程序集。无论引用是对静态程序集的引用还是对动态程序集的引用,运行库均使用相同的解析过程。
还可通过向调用方法仅提供有关程序集的部分信息的方式(例如仅指定程序集名称),对程序集进行动态引用。在这种情况下,仅在应用程序目录下搜索程序集,不进行其他检查。您可以使用不同加载程序集方法中的任何方法(例如 System.Reflection.Assembly.Load 或 AppDomain.Load)进行部分引用。如果希望运行库在全局程序集缓存和应用程序目录下检查引用的程序集,可以用 System.Reflection.Assembly.LoadWithPartialName 方法指定部分引用。
最后,可以使用诸如 System.Reflection.Assembly.Load 之类的方法进行动态引用并只提供部分信息;然后在应用程序配置文件中用 <qualifyAssembly> 元素限定该引用。该元素使您可以在应用程序配置文件中而不是在代码中提供完全引用信息,包括名称、版本、区域性和公钥标记(如果适用)。如果要在应用程序目录外完全限定对某个程序集的引用,或者如果要引用全局程序集缓存中的程序集,但又希望方便地在配置文件中而不是在代码中指定完全引用,就可以采用这一技术。
5.GC
一个跟踪过程,它传递性地跟踪指向当前使用的对象的所有指针,以便找到可以引用的所有对象,然后重新使用在此跟踪过程中未找到的任何堆内存。公共语言运行库垃圾回收器还压缩使用中的内存,以缩小堆所需要的工作空间。
垃圾收集器的基本算法很简单:
● 将所有的托管内存标记为垃圾
● 寻找正被使用的内存块,并将他们标记为有效
● 释放所有没有被使用的内存块
● 整理堆以减少碎片
GC参考:
http://www.csdn.net/Develop/Read_Article.asp?Id=13895
http://www.csdn.net/Develop/article/13%5C13896.shtm
6.。NET FrameWork
不用我多说,用过的都知道。参考:
ms-help://MS.VSCC/MS.MSDNVS.2052/cpref/html/cpref_start.htm