手把手教你做操作系统(三)
第三天:
Linux0.01代码分析-----总述
由于正在做操作系统的缘故,自己将对Linux0.01的源代码进行一个系统的分析,当然,里面的大多数东西是对Linus(father of Linux)注解的一个翻译,其中也加入了自己少许的解释。当然,由于自己技术能力的限制,翻译以及自己的注解的准确性都是不确定的,读者最好能找出源代码,参照代码看这些文档。
将花4天时间来分析全部的代码。
blacksun
2005.11.09
以下是初启时引导部分的代码,包括两个汇编代码文件:boot.s,head.s。
boot.s分析文档
boot.s的功能:1,boot.s被BIOS加载到地址0X7C00处,然后它把自身复制到地址0X90000处,并跳转到那执行指令;
2,boot.s使用BIOS中断把系统代码加载到地址0X10000处,然后关中断,并把系统代码复制到地址0X0000处,进入保护模式,并开始执行系统代码。系统代码开始的工作是:在自身的平台上重新初始化保护模式,并开中断;
关于boot.s一些说明:系统核心的长度必须小于8*2的16次方(因为如果大于的话就会在加载的时候覆盖boot.s的内容)。事实上,在系统核心中,我们不仅要做一些初始化的工作,还要处理一些关于存储方面的东西----由于实模式下,系统仅能访问1M的内容,所以地址大于1M的内存必须要被分页,而地址小于1M的内存的虚拟空间地址必须要于物理空间地址相一致。(这一段的内容精神我还没能领会,所以翻译上应该会有问题)
细则1:above is no longer valid in it's entirety. cache-memory is allocated
above the 1Mb mark as well as below. Otherwise it is mainly correct.(完全找不出怎么翻译,大家自己领会吧)
细则2:确定在编译时就已经设置好启动盘的类型。启动盘的类型不确定是致命伤。(这段好象是要求boot.s的512B内容的第510B处必须被设置为0XAA55----这个标志系统核心为合法----在系统核心代码中也有相同的要求)
加载部分的代码必须十分精简而且高效,因为一共只有512B的代码,这就使得代码的纠错性很低,所以必须要求程序尽量少的出错。
个人所加说明(由于自己刚学操作系统,所以正确性不确定,自己判断吧)---以后所有标注“个人所加说明”后的文字同。
1, 里面有一段关于中断的设置,实在是看不懂,只是看了些Linus(the father of Linux)的说明,感觉只要用他的代码就行了,没必要自己写。
2, 关于进入保护模式的代码,如下
mov ax,#0x0001 ! protected mode (PE) bit
lmsw ax ! This is it!(把AX的内容装入机器状态字)
3, Linus未说明的一些东西:
ⅰ,计算机的寻址模式:
①,实模式(default mode)
涉及地址计算的量:段地址(16位),偏移量(16位)
计算模式:物理地址(20位)=16*段地址+偏移量,
所以计算机的最大寻址范围为1M=2的20次方。
②,保护模式(protected mode)
涉及地址计算的量:选择器(决定选用哪个段),偏移量(32位)
计算方式:选择器-à地址转换,加上偏移量,得到物理地址
从上面可以看出,因为保护模式的偏移量是32位的,所以它的寻址范围可以达到4G。
ⅱ,在把系统核心代码复制到0X0000处后,进入保护模式前,还进行了GDT(全局描述表寄存器)和IDT(中断描述表寄存器)的设置,没看懂,现在还不知道有什么功能,知道后会补上。
blacksun
2005.11.09
上次编辑时间:2005-11-9
head.s分析文档
head.s的功能说明:head.s是32位的系统初始化代码。这部分代码就是前面所说的先被加载到0X10000位置,后来被复制到0X00000位置的系统启动代码。(注意:当前的寻址模式是保护模式,地址的位数应该是32位)
它的真正执行位置是0X00000,但是在系统完成启动后,它会被“页目录”所覆盖。“页目录”(page directory)是我直译的,我不知道它确切指的是什么,但是如果我在后面发现有统一的专业用语的话,我会替换它。(“页目录”让我想起了我在UNIX中学到的“页表”,它一般使用在分页存储管理时,但是它一般是放在一组寄存器里的,所以不敢贸然使用“页表”来翻译)
个人所加说明:
怎么办呢?由于我没有学过怎样在保护模式下和32位的汇编编程,这段代码几乎看不懂。要是现在再搬出汇编书彻底搞懂这些东西恐怕得花去好几周的时间。
鉴于我的时间,现在只好查找参考书上关于这个文件的说明,在自己实际编码时,可以在这上面进行些修改,然后拖过去用吧。
下面的说明选自《Linux0.01内核分析与操作系统设计》。
Head.s完成的工作包括:
ⅰ,setup_idt
建立一个有256个入口的IDT(interrupt descriptor table,中断描述表)表格,指向中断入口,然后装载IDT。在装载完成后,打开中断。因为IDT表被装在0X00000000地址,所以会覆盖掉一部分代码。(自己注:我还不知道IDT有多大,但是我想总归不会覆盖掉未执行的代码)
ⅱ,setup_gdt
装载GDT(global descriptor table,全局描述表)。在这个新的GDT中只有两个表项被装载,这两个表项是在init.s文件中被创建。它应该是紧接着IDT后被装载(我指的是地址)
ⅲ,setup_paging
这段程序通过设置在cr0中的page bit为0来设立一个页表(page table)。建立的页表可以映射机器前8MB的物理地址。在这个页表中,通常假设没有不合法的地址影射发生,这样这个页表被认为总是有效的。
ⅳ,自己所加:最重要的,它将调用系统主函数main()。(在UNIX6.0版本中,main()函数执行初始化的工作,以及进入进程调度循环,在Linux中的作用,我还不知道,将在“main.c分析文档”里分析)。
blacksun
2005.11.9
上次编辑时间:2005-11-10
OK,现在看来,尽管有点不完整,但是系统引导部分的代码我们还是分析完了。下面是从上面提到的书里摘的一段话:“通常,编写一个操作系统的第一个步骤是编写一段引导代码(这段引导代码通常是使用汇编语言编写)。使用汇编语言编写引导代码是有一点难度的工作,如果完全从开头编写这段引导代码,通常这个工作可能花去最少几周的时间。”
我想说什么呢?呵呵,鉴于我超烂的汇编语言水准,我想在我的系统里面还是用Linux0.01的初启代码为主,自己的修改为辅的方法来设计引导部分吧。
OK,今天的工作完成。(看下时间,其实已经是11.10凌晨了,但是这个文档的大部分工作还是在9号做的,还是署上9号吧)
blacksun
2005.11.09
上次修改时间:2005.11.10