目前的汉字字库,经历了点阵字库、矢量字库和曲线字库的发展。微软的TrueType字库和Adobe的Type系列字库利用曲线轮廓技术,在字形美观效果方面取得了很好的效果。
但由于汉字数量的繁多,字形的多变,使得汉字图像字库在应用上仍然具有一定的局限性。例如:在基于嵌入式系统的汉字书写学习机上,过大的存储量就意味着成本的提升。同时,汉字作为一种形声字,而之前的汉字字库仅仅包含了单个汉字的图形信息。随着汉字在信息处理方面的应用以及汉字信息处理技术的发展,汉字结构方面的信息在各方面的应用也愈来愈受到重视,只包含着汉字图形信息的字库已经没办法很好的满足需要了。
在这种背景下,一种全新的分级汉字字库(Hierarchical Chinese Character Database)就开始被研究人员所重视。分级汉字字库通过重复使用汉字中常用的部件生成每一个汉字,从而达到大大减少汉字图像字库存储量的目的。
目前常用的曲线轮廓字库已经在点阵字库的基础上大大减少了汉字字库的存储量,但由于汉字基数的巨大,仍然没能很好的解决存储量的问题。
分级汉字字库就是将字库分为不同的层次,不同的层次分别有笔画、部件以及汉字的信息。所以在减少存储量的同时,分级汉字字库还可以提供更多结构上的内容信息。
根据汉字的这个特点,我们可以将汉字中重复使用的部件和一些基本笔画集合起来,成为一个基本部件库,这样全部的汉字都可以由这个库生成。由于保存部件名和参数所需要的存储量是远远小于保存图形的存储量的,且部件基本库大小是一定的,这就使得整个汉字字库的存储量大大减少。