Linux启动过程全接触（1） - 王朝网络宽屏版

关于Windows启动过程介绍的文章可谓多如牛毛，而对于Linux的介绍却是凤毛麟角。凡是曾经使用过Linux的用户可能都会注重到，当计算机启动时，屏幕上会出现很多信息。一般情况下，这些信息我们可以通过以下的命令看到：

cat /var/log/dmesg more

这些信息究竟有什么含义？这个问题看起来似乎很轻易回答，因为只要在Linux参考书里查找一下，就会找出一个类似于这样的答案：“这是一些内核启动信息……”。但是“内核启动信息”到底是什么意思呢？

要想对Linux内部工作有所了解，就必须要对Linux内核的体系结构有一个全面的了解。下面我们就去揭开它的秘密。在此，我不想解释Linux内核的体系结构，只想解释（或者说是试图去解释）计算机系统启动进程中一些最基本的概念。这里所说的启动过程是指从按下开关到提示符出现的整个过程。

启动指的是什么

在操作系统的词汇里，启动是指通过处理器执行一些指令，把操作系统的一部分放入到主存中。在启动过程中，Linux内部的数据结构会被初始化，会被赋给一些初始值，并且某些进程会被创建。因为当计算机电源打开时，所有的硬件设备都处于一种不可预知的状态，内存也处于一种不活动的随机状态，所以，计算机的启动过程可以说是一个长且复杂的任务。因此，我们必须知道，之所以叫“启动”主要是因为计算机体系结构的原因。

在此提请读者注重：

1.对计算机内部的工作和内核的操作有一个基本的了解，对自己非常有益。

2.这篇文章中提到的所有文件，指的都是Linux内核2.4.2-2版本里的文件。这些文件对于所有的Linux内核来说都是相同的，并且可以在任何一个Linux系统里找到它们，此处我使用的是Red Hat 7.1。

3.在本文里，讨论范围限于IBM PC体系结构。

BIOS及其功能

当计算机打开电源时，内存里包含的是一些随机的数据，所有的东西都没有被初始化，操作系统也没有被加载。开始整个启动过程的是一个非凡的硬件电路，它触发CPU的Reset脚的逻辑值。然后，一些CPU的寄存器比如CS（一个分段寄存器：代码段寄存器，它指向含有程序指令的段），eip（在执行指令过程中，当CPU检测到一个意外事故发生时，它会做出三种类型的判定：错误、陷阱、中止，这取决于eip寄存器的值，它存储在内核模块栈里）就会被给定一个值。接着，物理地址为0xfffffff0的代码将被执行。这个地址被存储在一个只读存储器（ROM）里。BIOS（基本输入/输出系统）实际上是一段存储在ROM里的程序。它包含了一系列可以被某些操作系统调用，用于处理计算机各种硬件设备的中断驱动和低级程序。其中微软的DOS就是这样的一种操作系统。

Linux是否使用附于计算机系统的BIOS来初始化硬件设备？或者说，是否有其它的东西来完成同样的任务？不过这个问题没有那么简单，必须要了解一些知识。我们从80386模式开始。Intel微处理器实现地址翻译（从逻辑地址-线性地址-物理地址）有两种不同的途径，分别称作实模式和保护模式。实模式存在主要是为了使得处理器可以和较老的处理相兼容。事实上，所有的BIOS程序都是在实模式下运行的。但是，Linux内核是在保护模式下运行，而不是在实模式下。因此，一旦初始化完成后，Linux就不再使用BIOS，而是完全由自己来为计算机上的所有硬件提供驱动程序（这点和DOS是不一样的）。

那么什么时候Linux使用保护模式？为什么BIOS不能使用相同的模式？BIOS使用实模式是因为其在操作过程中使用的是实模式地址，并且在计算机刚打开电源时，只有实模式地址可用。一个实模式地址由段地址和偏移地址组成，因此，相应的物理地址就为段地址×（2×8）+偏移。

那么，这是不是意味着在整个启动过程中，Linux就从来不使用BIOS了呢？答案是否定的。在启动阶段，Linux从硬盘或者其它外部设备加载内核时，需要使用BIOS。

让我们来看一下启动时BIOS主要做了哪些操作：

1.BIOS要对硬件进行一系列彻底的检测。这个步骤主要是检查系统安装有哪些设备,以及它们工作是否正常。通常把这个步骤叫做自检（Power-On Self-Test,POST），这时会显示版本及其它很多相关的硬件信息。

2.BIOS要对硬件进行初始化。这一步非常重要，因为它要保证所有的硬件设备在IRQ（中断请求）和I/O端口操作时都没有冲突。等这步完成以后，它会显示一个已经安装的PCI设备表。

3.接着到了操作系统，BIOS将查找一个可以引导的操作系统。这取决于BIOS的设置，它可以从软盘、硬盘或者光盘启动。

4.一旦发现一个合法的设备，BIOS就会把其第一扇区的内容复制到物理地址，即从0x00007c00开始的内存中，然后跳至刚加载的地址并执行之。

到此为止，BIOS所要做的工作就全部完成了。

自举程序及其功用

BIOS调用一个专门的程序，这个程序的任务就是把操作系统的内核调入内存。这个程序就叫做自举程序（Boot Loader）。在我们继续下面内容之前，先来看一下启动系统的不同途径。

1.从软盘启动Linux

从软盘启动时，存储在软盘第一扇区的指令将被加载并执行。这个指令然后就会把其余的内核复制到内存中。

Linux内核可以装在1.44MB的软盘里，不过为了减少磁盘占用量，它们都进行了压缩。这个压缩过程是在编译时完成的，而解压缩的过程则由自举程序完成。

从软盘启动Linux时，自举程序要做的工作非常简单。它是一个位于/usr/src/linux-2.4.2/arch/i386/boot/bootsect.S的汇编语言文件。当我们编译Linux内核源代码，或者获取一个新的内核时，这个可执行的汇编代码就会被放在内核程序的前端。由此可见，要制作一个可启动的Linux软盘其实很简单。我们只要从磁盘的第一个扇区拷贝Linux内核，就可以创建一个可启动软盘。当BIOS加载软盘的第一个扇区时，它实际上拷贝的是自举程序。自举程序由BIOS调用（跳到物理地址为0x00007c00的位置），然后执行以下的操作：

(1)把自已从地址0x00007c00移动到0x00090000；

(2)使用地址0x00003ff4，创建“实模式”栈；

(3)设置磁盘参数表，这里使用的是BIOS提供的软盘驱动程序；

(4)通过调用BIOS程序显示“Loading”信息；

(5)自举程序调用BIOS程序来加载软盘上内核的setup()函数，并把它放在起始地址为0x00090200的内存中；

(6)接下来自举程序调用一个BIOS程序，这个程序从软盘加载剩余的内核程序，并将其放入起始地址为0x00010000（所谓的低地址）或者0x00100000（所谓的高地址）；

(7)然后，跳转到setup()函数。

2.从硬盘启动Linux

当系统从硬盘启动时，启动过程又有所不同。硬盘的第一个扇区叫做MBR（Master Boot Record），其上存储着分区表和一个小程序。这个程序加载存储由操作系统的第一扇区来开始启动。Linux是一个高度灵活且非常优秀的软件，所以在MBR里，它使用一个叫做LILO的程序来代替上述的那个程序。LILO答应用户选择所要启动的操作系统。

一般来说，Linux是从硬盘启动的。这就需要不同的自举程序。在Intel系统里，用得最多的自举程序就是LILO。对于其它的体系结构，还存在着别的自举程序。LILO可以安装在MBR上（请注重：在安装Red Hat Linux时，有一个步骤会让用户选择把LILO安装到MBR或者引导扇区）或一个活动分区的引导扇区上。

由于LILO太大，MBR无法容纳，所以它被分成两部分。MBR（或者磁盘分区的引导扇区）包含有一个小的自举程序，它被BIOS载入到起始地址为0x00007c00的内存中。然后，这个小程序再把自己移到0x0009a000地址处，接着设置实模式栈，最后加载第二部分的LILO自举程序（请注重：实模式栈地址范围是0x0009b000 到 0x0009a200）。

第二部分的LILO会从磁盘读取所有可用的操作系统，并且给用户列出，以选择所要启动的系统。一旦用户选择完成，自举程序就会加载相应的扇区内容到内存中并且执行之。

自举程序被BIOS调用时（跳到物理地址为0x00007c00处），要执行以下操作：

(1)把自已从地址0x00007c00移动到0x00090000；

(2)使用地址0x00003ff4，创建“实模式”栈；

(3)设置磁盘参数表。这里使用的是BIOS提供的软盘驱动程序；

(4)通过调用BIOS程序显示“Loading Linux”信息；

(5)自举程序调用BIOS程序来加载软盘上内核的setup()函数，并把它放在起始地址为0x00090200的内存中；

(6)接下来自举程序调用一个BIOS程序，这个程序从软盘加载剩余的内核程序，并将其放入起始地址为0x00010000或者0x00100000；

(7)然后，跳转到setup()函数。