什么是大型文件的索引组织,是B-还是B+

王朝知道·作者佚名  2010-10-30
窄屏简体版  字體: |||超大  
 
分類: 電腦/網絡 >> 操作系統/系統故障
 
問題描述:

如果能尽快给出正确答案并说明原因,还可以加分!

參考答案:

在大型文件系统中,采用索引可以有效的提高查找的效率,建立文件时,在输入数据记录的同时,建立一张索引表,每个索引表项记录相应数据块的地址。检索文件记录时,先将外存上的索引表读入内存,从索引表中查到数据记录的地址后,再将相应的记录读入内存。

如果文件中的数据在使用过程中记录变化较多,则要频繁地对索引表进行插入和删除操作,这时对索引表采用树型结构较好。但是如果文件系统很大,则索引表也往往很大,需分块读入内存,若采用二叉查找树的结构,仍需多次访问外存,而访问外存的代价很大,为了减少访问外存的次数,就应尽量减少索引表的深度。简要介绍一下广泛应用于大型文件系统中的B-树。

B-树是一种平衡的多路查找树。

一棵m阶的B-树,如果它非空,则它必须同时满足下列几个条件:

(1)若B-树的根结点不是叶子结点,则它至少有两棵子树;

(2)树中每个结点的关键字数不得超过m;

(3)除根结点之外的非叶子结点至少含有「m/2 棵子树;

(4)B-树中每个非叶子结点的结构为 ( n,P1,K1,P1,K2,……Pn-1,Kn,Pn)。其中 0≤n≤m ,n为该结点中含有关键字的个数;Ki(i=1,2,……,n)为数据记录的关键字,并且Ki < Ki+1,Pi( 0≤i≤n)为指向该结点子树根结点的指针,且指针Pi-1所指向的子树中的所有结点的关键字均小于Ki;指针Pi所指向的子树中的所有结点的关键字均大于Ki。

(5)B-树所有的叶子结点都在同一层上。他们不带有效信息,故又称失败结点。

下图是一棵4阶B-树,深度为3。

下面简单介绍一下B-树的查找过程,对B-树的插入和删除算法则不作深入介绍。

由B-树的定义可知,对B-树的查找与二叉查找树的算法类似,它是一个顺指针查找和关键字比较的交叉的过程。例如要查找上图中关键字为36的结点,从根结点①开始,找到结点③,其子树中的结点关键字范围在16到40之间,而③只有一个关键字23,由于23〈36,故应沿着第二个指针找到结点⑧,同样,结点⑧中35〈36,故应沿着⑧中第二个指针查找,但这个指针指向一个叶子结点,查找失败。这也是为什么B-树中的叶子结点称为失败结点的原因。

小贴士:① 若网友所发内容与教科书相悖,请以教科书为准;② 若网友所发内容与科学常识、官方权威机构相悖,请以后者为准;③ 若网友所发内容不正确或者违背公序良俗,右下举报/纠错。
 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航