linux-0.11启动过程描述

简单描述

当PC的电源打开后，80X86结构的CPU将自动进入实模式，并从地址0xFFFF0开始自动执行程序代码，这个地址通常是ROM-BIOS中的地址。PC机的BIOS将执行某些系统的检测，并在物理地址0处开始初始化中断向量。此后，它将可启动设备的第一个扇区（磁盘引导扇区，512字节）读入内存绝对地址0x7C00处，并跳转到这个地方。启动设备通常是软驱或是硬盘。

启动之前

Linux启动是需要启动盘的，这里假定启动盘就是当时的1.44MB的A盘。我们先来看下各个模块在启动盘的位置信息。

1.44MB磁盘共有2880个扇区（1.44*1000*1000/500=2880，要理解奸商的计算方式），bootsect.s代码是磁盘引导块程序，驻留在磁盘的第一个扇区中（引导扇区，0磁道（柱面），0磁头，第1个扇区），setup模块占用随后的4个扇区，而0.11内核system模块大约占随后的240个扇区。还剩下2630个扇区未被使用。这些剩余的未用空间可被利用来存放一个基本的根文件系统，从而可以创建处使用单张磁盘就能让系统运转起来的集成盘来。

启动过程

这里我们可以看到linux/boot/目录下有三个文件和启动相关。

BIOS和boot/bootsect.s

Linux最开始的部分是用8086汇编语言编写的(boot/bootsect.s)，它将由ROM BIOS自检后读入到内存绝对地址0x7C00(31KB)处并执行之，bootsect执行时，就会把自己[1]移动到内存绝对地址0x90000(576KB)处，并把启动设备中后2KB字节代码(boot/setup.s)读入到内存0x90200处，然后利用BIOS终端0x13取磁盘参数表中当前启动引导盘的参数，接着在屏幕上显示“Load
system…”字符串。而后将system模块读入到内存地址0x10000(64KB)开始处，因为当时system模块的长度不会超过0x80000字节大小（即512KB），所以bootsect程序把system模块读入物理地址0x10000开始位置处时并不会覆盖在0x90000(576KB)处开始的bootsect和setup模块。随后确定根文件系统的设备号，若没有指定，则根据所保存的引导盘的每磁道扇区数判别出盘的类型和种类（是1.44MB A盘吗？）并保存其设备号于root_dev（引导块的508地址处），最后长跳转到setup程序的开始处(0x90200)执行setup程序。

从机器加电开始顺序执行的程序如下图：

boot/setup.s

boot/setup.s主要负责利用ROB BIOS终端读取机器系统数据，并将这些数据保存到0x90000开始的位置（覆盖掉了bootsect程序所在的位置），所去读取的参数和保留的内存位置如下表：（这些参数将被内核中的相关程序使用）

然后setup程序将system模块移动到物理内存起始位置处[2]，这样system模块中代码的地址也即等于实际的物理地址，便于对内核代码和数据进行操作。下图清晰地显示出Linux系统启动时这几个程序或模块在内存中的动态位置。其中，每一竖条框代表某一时刻内存中个程序的映像位置图。在系统加载期间将显示信息“Loading…”。然后控制权将传递给boot/setup.s中的代码，这是另一个实模式汇编语言程序。

接下来加载中断描述符表寄存器(idtr)和全局描述符表寄存器(gdtr)，开启A20地址线，重新设置两个终端控制芯片8259A，将硬件中断号重新设置为0x20-0x2f。最后设置CPU的控制寄存器CR0(也称机器状态字),从而进入32位保护模式运行，并跳转到位于system模块最前端部分的head.s程序继续运行。

为了能够head.s在32位保护模式下运行，在本程序中临时设置了中断描述符表(IDT)和全局描述符表(GDT)，并在GDT中设置了当前内核代码段的描述符和数据段的描述符。下面在head.s程序中会根据内核的需要重新设置这些描述符表。

boot/head.s

head.s程序在被编译生成目标文件后会与内核其他程序一起被链接成system模块，位于system模块的最前面开始部分，这也就是为什么称其为头部(head)程序的原因。system模块将被放置在磁盘上setup模块之后开始的扇区中，即从磁盘上第6个扇区开始放置。一般情况下Linux0.11内核的system模块大约有120KB左右，因此在磁盘上大约占240个扇区。

从这里开始，内核完全都是在保护模式下运行了。head.s汇编程序与前面的语法格式不同，它采用的是AT&T的汇编语言格式，并且需要使用GNU的gas和gld进行编译链接。因此要注意代码中赋值的方向是从左到右。

这段程序实际上处于内存绝对地址0处开始的地方。这个程序的功能比较单一。首先是加载各个数据段寄存器，重新设置中断描述符表idt，共256项，并使各个表项均指向一个只报错误的哑中断子程序ignore_int。中断描述符表中每个描述符项也占8字节，其格式如下：

在设置好中断描述符表之后，本程序又重新设置了全局段描述符表gdt。实际上新设置的GDT表与原来在setup.s程序中设置的GDT表描述符除了在段限长上有些区别以外(原为8MB，现为16MB)，其他内容完全一样。当然我们也可以在setup.s程序中就把描述符的段限长直接设置成16MB，然后直接把原GDT表移动到内存适当位置处。因此这里重新设置GDT的主要原因是为了把gdt表放在内存内核代码比较合理的地方。前面设置的GDT表处于内存0x902XX处。这个地方将在内核初始化后用作内存高速缓冲区的一部分。

接着使用物理地址0与1MB开始处的字节内容相比较的方法，检测A20地址线是否已真的开启。如果没有开启，则在访问高于1MB物理内存地址时CPU实际只会循环访问(IP MOD 1Mb)地址处的内容，也即与访问从0地址开始对应字节的内容都相同。如果检测下来发现没有开启，则进入死循环。然后程序测试PC机是否含有数学协处理芯片(80287、80387或兼容芯片)，并在控制寄存器CR0中设置相应的标志位。

接着设置管理内存的分页处理机制，将页目录表放在绝对物理地址0开始处(也是本程序所处的物理内存位置，因此这段程序将被覆盖掉)，紧随后面放置共可寻址16MB的4个页表，并分别设置它们的表项。页目录表项和页表项格式如下。

这里每个表项的属性标志都被设置成0x07(P=1、U/S=1、R/W=1)，表示该页存在、用户可读写。这样设置内核页表属性的原因是:CPU的分页机制和分页管理都有保护方法。分页机制中页目录表和页表项中设置的保护标志(U/S、R/W)需要与段描述符中的特权级(PL)保护机制一起组合使用。但段描述符中的PL其主要作用。CPU会首先检查段保护，然后再检查页保护。如果当前特权级CPL<3(例如0)，则说明CPU正在以超级用户(Supervisor)身份运行。此时所有页面都能访问，并可随意进行内存读写操作。入宫CPL=3，则说明CPU正在以用户(User)身份运行。此时只有属于User的页面(U/S=1)可以访问，并且只有标记为可读写的页面(W/R=1)是可写的。而此时属于超级用户的页面(U/S=0)则既不可写、也不可以读。由于内核代码有些特别之处，即其中包含有任务0和任务1的代码和数据。因此这里把页面属性为0x7就可保护这两种任务代码不仅可以在用户态下执行，而且又不能随意访问内核资源。

最后，head.s程序利用返回指令将预先放置在对战中的/init/main.c程序的入口地址弹出，去运行main()程序。

head.s程序执行结束后，已经正式完成内存页目录和页表的设置，并重新设置了内核实际使用的中断描述符表idt和全局描述符表gdt。另外还为软盘驱动程序开辟了1KB字节的缓冲区。此时system模块在内存中的详细映像如下：

启动部分识别主机的某些特性以及VGA卡的类型。如果需要，它会要求用户为控制台选择模式。然后将整个系统从地址0x10000移至0x0000处[3]，进入保护模式并跳转至系统的余下部分（在0x0000处）。此时所有32位运行方式的设置启动被完成：IDT、GDT以及LDT被加载，处理器和协处理器也已确认，分页工作也设置好了；最终调用init/main.c中的main()程序。

boot/head.s可能是整个内核中最有诀窍的代码。

注意点

上面的所有过程都不能出错，一旦出错，计算机就会死机，在操作系统还没有完全运转之前是处理不了出错的。

根文件系统问题[4]

仅在内存中加载上述内核代码模块并不能让Linux系统运行起来。作为完整可运行的Linux系统还需要有一个基本的文件系统支持，即根文件系统。Linux
0.11内核仅支持MINIX的1.0文件系统。根文件系统通常在另一个软盘上或者在一个硬盘分区中。为了通知内核所需要的根文件系统在什么地方，bootsect.s程序的第43行上给出了根文件系统所在的默认块设备号。在内核初始化时会使用编译内核时放在引导扇区第509、510(0x1fc–0x1fd)字节中的指定设备号。

疑问点

是谁将bootsect移动到内存绝对地址0x90000(576KB)处，是bootsect自身？

答：按照上述理解与分析，搬移bootsect程序的应该是它自身。
系统上电时BOIS已经在起始位置（也就是物理地址0位置）初始化了中断向量，此处将system模块还移动到物理内存其实位置处不会覆盖之前的中断向量？

答：这是因为BIOS ROM中的中断调用（大小为0x400直接，也就是1KB）是用来获取机器的一些参数（例如显示模式、硬盘参数表等）。而启动setup程序时，这些参数已经获取完毕，就可以直接被覆盖掉了，这也是bootsect不把system模块直接加载到物理地址0x0000开始处的原因。(真的是这样吗？系统启动之后就不再需要这些中断了？可是微机实验中的中断都是可用的啊？)
上面已经说是setup完成的将system模块（也就是整个系统）移动到物理内存起始位置，但是此处由说是head进行的搬移，似乎出现了矛盾？
为什么需要有文件系统才能使Linux系统运行起来，内核模块应该运行起来了吧？

从硬盘启动系统

若需要从硬盘设备启动系统，那么通常需要使用其他多操作系统引导程序来引导系统加载。比如：Shoelace、LILO或Grub等多操作系统引导程序。此时bootsect.s所完成的任务会由这些程序来完成。bootsect程序就不会被执行了。因为如果从硬盘启动系统，那么通常内核映像文件Image会存放在活动分区的根文件系统中。因此你就需要知道内核映像文件Image处于文件系统中的位置以及是什么文件系统。即你的引导扇区程序需要能够识别并访问文件系统，并从中读取内核映像文件。

从硬盘启动的基本流程是：系统上电后，可启动硬盘的第1个分区（主引导记录MBR - Master Boot Record）会被BIOS加载到内存0x7c00处并开始执行。改程序会首先把自己向下移动到内存0x600处，然后根据MBR中分区表信息所指明活动分区中的第1个扇区（引导扇区）加载到内存0x7c00处，然后开始执行之。如果直接使用这种方法来引导系统就会碰到这样一个问题：即根文件系统不能与内核映像文件Image共存。

我所想到的解决方法有两个。一种办法是专门设置一个小容量的活动分区来存放内核映像文件Image。而相应的根文件系统则放在另一个分区中。这样虽然浪费了硬盘的4个主分区之一，但应该能在对bootsect.s程序作最少修改的前提下做到从硬盘启动系统。另一个办法是把内核映像文件Image与根文件系统组合存放在一个分区中，即内核映像文件Image放在分区开始的一些扇区中，而根文件系统则从随后某一指定扇区开始存放。这两种方法均需要对代码进行一些修改。