仅有以页为单位的物理内存分配方案对于编写内核来说是远远不够的,内核需要一种高效的、最好以字节为单位的虚拟内存分配机制,也就是实现一个简单易用的malloc操作。
在Sinos中,内核模块所需的动态数据结构均被称为内核对象,由内核对象管理器统一负责对象空间的分配和回收。作为补充,Sinos还实现了以页为单位的内存分配函数和虚地址的映射函数,这里暂不涉及。
所谓内核对象,其主体是一个固定大小的结构体,管理器负责其内存空间的管理。除此之外,Sinos对内核对象还支持其构造函数和析构函数,通过注册对象类型时提供的两个函数指针来实现。也就是说,内核对象提供的不仅仅是一个malloc,而是一个new操作[1]。
可以使用内核对象之前,首先要注册该对象类型,向对象管理器提供对象的大小、类型常数、构造/析构函数指针等信息,以便对象管理器建立相应的管理结构。注册完成后,可以得到一个对象类型的句柄[2] ,以后通过这个句柄就可以建立新的内存对象。当然,由于技术原因,在对象释放时也必须提供对象的类型句柄。
一个对象类型经过注册后,对象管理器生成一个管理结构,记录着它的类型信息和一些管理数据。其中有一项为该类型对象所属的内存页链的链表头,链接着所有相关的页面。
实现对象内存管理的关键,是对象管理器所分配的每一块物理内存都必须是自描述的,即必须将链表信息包含在自身的空间中,因为没有其它地方可以存放这些链表信息。
在Sinos中,同一类型对象所用的内存以页为单位链接在一起,每一页的起始处即为页的链表结点数据,在结点数据之后才是真正的对象数据。采用以页为单位链接有一个缺点,即单个对象的大小不能超过一页的大小(还要减去结点数据),所以理想的情况应该是结点大小可调,可以使用2页、4页或更多页[3] 作为页结点,多页结构还可以提高内存的利用率(开销减小了)。这些可以在以后的开发中扩展,当前版本的Sinos只支持单页的内存结点,下面的讨论均考虑到多页的情况。
在具体的每一结点空间中,最初的若干个字节为当前结点的管理结构,包含有链表信息、结点容量、结点剩余容量等信息。在管理结构之后,是一张结点使用情况的位图,位图大小视对象大小而定。
在一个结点中可以容纳的每一个对象都在位图中用一位来表示其使用情况,所以位图的大小为
[4]。出于性能考虑,位图的大小是经过4字节对齐操作的,加上结点控制结构也是4字节对齐的,可以保证结点数据区从4字节边界开始,保证数据操作的性能。实际上,对象内存结点链表是一条双向循环链表,对象控制结构中的结点指针指向的是第一个有空闲空间的结点。
当需要建立一个新对象时,对象管理器首先检查对象控制结构中的结点指针是否指向一个有空间的结点。如果不是,就表明当前所有结点的空间都已耗尽,需要新申请一个内存结点。当找到有空闲的结点时,就搜索结点位图,找出空间的真正位置。经过计算就可以得到新建对象的指针,调用该类型对象的构造函数(如果有的话),就完成了建立新对象的任务。
当删除对象时,首先要得到对象结点的控制结构(当然,析构函数调用得更早)。得到结点控制结构很容易,如果使用的是单页的结点,则控制结构位于对象指针所在的内存页的起始处,即低地址端的4096字节边界处;双页或四页的结点也一样,只不过是位于8192或16384字节边界处。需要得到结点控制结构也就是多页结点页数必须为2的整数次幂的原因。
得到结点控制结构后,只需要把结点位图中对象所对应的位清除就表示已经删除了对象。然后,需要维护结点的空闲空间计数。如果计数与结点总空间相等,就表明当前结点中已没有对象,可以删除了。删除结点之后,还要搜索所有结点的循环链表,找到一个有空间的结点,再把对象类型控制结构中的指针指向它[5] 。
最后有一个问题,对象类型控制结构放在哪?结点的控制结构是放在结点自身空间中的,但那些类型信息没有地方放。解决方法是把那些类型控制结构同样看作对象,使用对象管理器自身来进行管理。这样,对象管理器就只要解决最初类型控制结构自身的类型信息存放问题了。这很容易解决,只要在内核程序中使用全局或是静态变量就行了,这些变量的地址位于内核数据区,而数据区会在最初解析PE内核时一并分配空间,这些空间位于常规内存。
所有核心态的动态内存均由这种方式来管理。
[1] 注意,这里对象、构造函数、析构函数、new等概念与C++没有关系,只是借用其名称和定义而已。
[2] 在Sinos中,大多数情况下句柄的值都是管理结构的指针值,这样可以简化操作。
[3] 由于对象管理算法的要求,多页结点的页数应该是2的整数次幂。
[4] 严格的公式应该是
,但这么写相差不大,而且在位图对齐4字节边界后几乎没有差别。[5] 如果应用程序在该临界处反复建立和删除对象,会在造成分页系统的一种震荡(反复分配和释放页面),尽管这种情况不会经常出现。这里需要更改操作流程,先搜索空闲结点,找到后再释放结点。留待下一版本改进。