CLR和JRE的运行机制的初步总结
--------------------------------------------------------------------------------
概念比较:
Java C#
byte code IL(字节码,中间语言)
jvm.dll mscrolib.dll,mscrojit.dll(虚拟机)
JRE CLR(运行环境)
JDK .Net Framework(开发框架)
package assembly(类库,程序集)
一、关于类库的版本治理问题
Java和C#代码运行要依靠其运行环境(JRE,CLR)和运行环境带的基础类库(C#称为配件或者程序集Assembly),此外还会有一些第三方的类库或者自己开发的类库。假如运行环境版本不一致,或者引用的类库版本不一致都会带来程序不能正常运行。比如一个Java程序是在JDK1.2上开发,假如在JRE1.4上运行,一般情况下可以向下兼容,但也有例外,有些GUI程序在JDK1.4上面运行结果很可能会不同。
JRE的版本治理
Java的解决办法是每个程序自己携带一套JRE。
我的机器上已经被安装了好多套JRE和JDK了(JDK包括了同版本的JRE,此外还包括有编译器和其它工具),它们分别是:
BEA Weblogic Server 7.0 自带一套 JDK1.3.1_02
我下载了一套最新的JDK1.4.1_02
JBuilder9自带一套JKD1.4.1_02
Oracle8.1.7自带一套JRE1.1.7
Ration Rose自带一套JDK1.3
DreamWeaver自带一套JDK1.3
6套JRE,每套JRE都被各自安装到不同的目录,不会互相影响。当在控制台执行java.exe,操作系统寻找JRE的方式如下:
先找当前目录下有没有JRE
再找父目录下有没有JRE
接着在PATH路径中找JRE
注册表HKEY_LOCAL_MACHINESOFTWAREJavaSoftJava Runtime Environment 查看CurrentVersion的键值指向哪个JRE
最常用的是在PATH路径中找JRE,一般情况下,自己的程序运行之前都会先在批处理文件里面临时设置PATH,把自己用的JRE放到PATH路径最前面,所以肯定会运行自己带的JRE,不会造成版本混乱。
.Net Framework的版本治理
.Net Framework被固定安装在C:WinntMicrosoft.NETFrameworkv版本号目录下,并且在同一台机器只能安装一套,要安装1.1版本的.Net Framework,就必须先删除1.0的。听说刚发行的.Net Framework1.1已经对1.0做了很多改进,甚至基础类库的层次也有所变动。看来在旧版本的.Net Framework开发的程序将来往新版本上面迁移的时候少不了修改程序代码。
JRE的基础类库
JRE自带的基础类库主要是JRElib
t.jar这个文件,包括了Java2平台标准版的所有类库。和JRE的版本一致。
.Net Framekwork的核心类库
.Net Framekwork的核心类库被放置在C:Winntassemblygac目录下,按照不同的名称空间放在不同目录中,不像JRE打成了一个包。并且可以同时存在不同的版本,例如:
某类库1.0版本 C:Winntassemblygac名称1.0名称.dll
某类库1.1版本 C:Winntassemblygac名称1.1名称.dll
这样做,虽然很灵活,可以随时把类库更新到最新的状态,但是很轻易带来版本治理的复杂度,造成版本不一致。
JRE类库的查找方法和版本治理
JRE中由ClassLoader负责查找和加载程序引用到的类库,基础类库ClassLoader会到rt.jar中自动加载,其它的类库,ClassLoader在环境变量CLASSPATH指定的路径中搜索,按照先来先到的原则,放在CLASSPATH前面的类库先被搜到,Java程序启动之前建议先把PATH和CLASSPATH环境变量设好,OS通过PATH来找JRE,确定基础类库rt.jar的位置,JRE的ClassLoader通过CLASSPATH找其它类库。但有时候会出现这样的情况,希望替换基础类库中的类库,那么也可以简单的通过-Djava.endrosed.path=...参数传递给java.exe,于是ClassLoader会先于基础类库使用java.endrosed.path参数指定路径的类库。因此Java的版本治理是非常简单有效的,也许很原始,不过很好用,简单就不轻易出错。(所以我很希奇Eric Ramond为什么批评Java的类库治理机制,他还居然批评Java的接口,令人怀疑他对Java的了解程度)
.Net Framework的类库治理机制
.Net Framework的类库治理机制相当强大和复杂,分为私有类库和共享类库。
私有类库就放在exe程序当前路径下,或其相对路径中,只有当前程序可见。
共享类库需要在GAC(Global Assembly Cache)中注册,注册过程比较复杂,首先要用工具生成公开/私有密钥对,然后结合密钥和类库版本号连编,最后使用工具注册到GAC中好以后,会被放在"C:Winntassemblygac类库的名称空间版本号"目录下,不同的类库版本在注册的时候会按照版本号分开放置:
某类库1.0版本 C:Winntassemblygac名称1.0名称.dll
某类库1.1版本 C:Winntassemblygac名称1.1名称.dll
也就是可以同时存在一个类库的n个版本,至于在程序中用哪个版本,在程序的配置文件中声明,CLR会根据声明来调用相应的版本的类库。我觉得.Net实现方法未免太复杂了一些,将所有共享类库都塞到一个系统目录下,并且同一个类库还有n个版本,将来.Net第三方开发的类库逐渐丰富起来以后,.Net类库的GAC也会越来越庞大,会不会也搞得和Windows注册表一样难以维护?软件发布到服务器上的时候,类库要再注册一次,服务器会逐渐形成一个庞大的树状的GAC,GAC里面存放着组件的n个版本。试想经过一段时间之后,C:Winntassemblygac目录会越来越庞大,有的组件甚至有n个版本都放在那里,你又不敢随便删除,不知道是不是有程序需要使用,我不明白MS为什么要把这么简单的事情搞到这么复杂?
综上所述,Java的版本治理方式简单而有效,C#的版本治理方式功能强大,不过是不是太复杂了?会不会搞成第二个注册表一样的东西?
二、虚拟机启动和加载类库的方式
Java的虚拟机启动和加载类库
在Console执行java.exe xxx命令以后,如前所述的寻找JRE,OS找到JRE目录,根据java.exe的传递参数,选择加载Server版的jvm.dll还是Client版的jvm.dll,然后加载jvm.dll,把控制权交给jvm.dll。
接下来,jvm.dll进行初始化,分配内存等等动作,然后在CLASSPATH路径中寻找class,找到class以后,寻找class中的程序入口点Main函数,然后从Main函数执行程序,在执行过程中,使用ClassLoader动态加载一系列引用到的类。当调用到native方法时,jvm.dll告诉OS在JREin目录下寻找某某DLL文件,调入内存,于是实现了JNI调用。
.Net的虚拟机的启动推测
我对.Net的虚拟机的启动过程还一知半解,自己写了一些例程,并且用内存工具来检测观察,推测.Net的运行机制,先来抛砖引玉,请熟悉Windows平台编程的朋友指教。.Net有3个目录中的文件在执行的时候会被加载
1、C:WINNTMicrosoft.NETFrameworkv版本号
该目录下的mscorlib.dll,mscorrsn.dll,mscorwsk.dll,mscorjit.dll是核心DLL,大概是运行虚拟机的必要文件,其中mscrolib.dll是入口点。此外,该目录下还有一些.Net的System名称空间的IL类库,与C:Winntassemblygac相应目录下的IL类库完全一样,这些是最核心的基础类库。.Net的编译器,检查器等等工具软件也在该目录,推测System名称空间的核心类库之所以在这个目录下copy一份是因为作为.Net的编译器等工具的私有类库之用。
2、C:Winntassemblygac
该目录下放置.Net共享类库,如前所述
3、C:Winntassembly
ativeimages_.Net版本号
在该目录下也有一些以System名称空间开头的核心类库,推测是MS为了加快CLR的执行效率把核心类库进行本地化,编译为native image的同名DLL。可以观察到该目录下的同名DLL文件,比GAC目录下的同名DLL文件体积大,可能是因为link底层DLL库的缘故。
某核心类库 C:Winntassembly
ativeimages_.Net版本号名称空间.Net版本号_散列码名称.dll
另外值得注重的地方是有两个mscorlib.dll
1、C:WINNTMicrosoft.NETFrameworkv版本号mscrolib.dll (1.88MB)
2、C:WINNTassemblyNativeImages1_v版本号mscorlib版本号__散列码mscrolib.dll (3.07MB)
mscrolib.dll (1.88MB)还是一个IL码的版本,所以映射了一个native的版本的mscrolib.dll (3.07MB),来加快CLR的速度。
当IL的exe程序被双击执行时,OS Loader读入程序,识别出是IL,根据IL内部的引用定义,加载mscorlib.dll,而mscorlib.dll也是IL,内部引用C:winntsystem32mscoree.dll,于是再加载mscoree.dll,然后把控制权交给mscoree.dll,mscoree.dll接着加载mscrorsn.dll,mscrowsk.dll,mscrojit.dll,为了加快mscorlib.dll的调用,加载mscorlib.dll的native image版本,然后由mscorlib.dll接管控制权(不知道这两个mscorlib.dll是如何来上管IL,下连native code的?)最后寻找IL码程序的入口点Main函数,开始执行程序,在执行过程中,使用Class Loader动态加载一系列引用到的类,在当前路径下,在共享类库的GAC中查找等等。
这里和jvm.dll不同的一点是,jvm.dll加载的基础类库和加载其它类库方式完全一样,全部都是字节码的class。而mscrolib.dll加载以System名称开头的核心类库的时候,使用了“不正当竞争手法”。mscrolib.dll从GAC中加载共享核心类库之后,又C:Winntassembly
ativeimages_.Net版本号名称空间 目录下加载了核心类库的native版本,这样一来,自然CLR运行起来要快多了。非凡是图形图像类库全部都有native映射版本,所以CLR上运行GUI焉能不快?
对比CLR和JRE的加载过程,比较不同的地方是mscorlib.dll和System核心类库都有一个native image,可能这是CLR运行速度比较快的一个主要原因吧。
分析完以后有一个非凡明显的感受,Java的底层运行机制设计的非凡简单,而.Net的底层运行机制设计的非凡复杂。但是在企业层刚好相反,J2EE设计的非凡复杂,而.Net却设计的非凡简单,真是有意思!
Java的底层机制设计虽然简单,但是很健壮,.Net设计使得它的CLR速度快,类库治理功能强大,但是不是比Java更优秀,还要等以后慢慢看了。
注:
我查了一下《.Net Essential》这本书,上面提到这样的说法。
MS更新了Windows各个版本的OS Loader程序,使得OS Loader可以识别.Net PE格式的exe文件,当执行Windows Native PE格式的exe文件的时候,OS Loader按照以往的方式加载系统DLL。假如是.Net PE格式的exe文件,OS Loader加载mscorlib.dll,然后把控制权交给mscorlib.dll。