传统的图书馆以纸张来保存图书资料,图书馆没有电脑,没有视频资料。但是随着信息化建设,以数字的形式来保存图书资料更为便利和轻易治理,同时能实现在任何地点借阅图书。
全球图书馆的数字化带动国内数字图书馆的建设,国家把图书馆的数字化已经列入863计划,国家图书馆也率先实现了数字化,初期存储容量为10TB。在这个情况下,轰轰烈烈的数字图书馆建设在全国的政府图书馆和高校中展开。
这其中,高校数字图书馆的建设已经成为当前的一个热点。作为校园信息化中的一个重要组成部分,数字图书馆的建立除了可以将众多图书资源和多媒体信息放在网上供师生共享、检索之外,对于改变传统的教学模式,提升学校的整体形象,提高学校在教学科研竞争中的地位都大有裨益。
但究竟做成什么样,才算是一个真正的数字图书馆?数字图书馆应该如何规划、建设?
内容分析
一座完整的数字图书馆,显然不会只有图书,而应该是集成音频、视频、多媒体等各种其它形式的媒体资源,创造出一个前所未有的阅读新空间。例如,读者在数字图书馆查找“红楼梦”,不但可以看到纸本图书的借还书状态,还可以阅读到数字图书、红楼梦音乐以及《红楼梦》电视连续剧等。
如此丰富的媒体资源存放在光纤磁盘阵列上是最合适的,因为光纤磁盘阵列已经被广泛用于多媒体应用环境中。例如:电视台的非线性编辑、小区电影点播等系统。光纤磁盘阵列能够提供很高的持续带宽,在大用户量访问的情况下,依然能够提供较高的数据传输带宽。
建设模式分析
电子图书的出现使得用户不必再花费力气将现有的一些通用的书籍进行数字化,从这个角度看,高校的图书馆可以先在选取一些通用的数字图书(大概25~30万册),然后再着手特色馆藏图书的数字化工作。
根据这一模式,分阶段进行数字图书馆建设成为主流的建设模式。第一阶段先满足现有的需求,以选取超星资源库中25万册图书计算,大概需要2.5TB左右的存储容量,按每年图书数字化速度是3万册计算,第一阶系统需要3TB左右的存储容量。以后,可以逐步扩展。
技术分析
高校用户分阶段建设数字图书馆,是根据数字图书馆建设模式和保护投资角度来考虑的。从存储行业的发展趋势来看,传统的SCSI磁盘阵列在未来几年将逐步被淘汰,取而代之的则是光纤磁盘阵列。
此外,从资源利用的角度来看,现在假如购买10TB的存储设备,也会是一种资源的浪费。通过刚才计算,第一阶段需求是3TB左右,每年会增长300GB~400GB,加上多媒体资料的增加(按1TB计算),每年的存储需求量会在1.3TB左右,这样要在5~6年后才能达到10TB的容量,随着光纤磁盘的成本不断的下降,可以为用户节省大量的资金。
相关链接
以国内某数字图书馆应用软件的图片格式PDG为例计算,一所大学数字图书馆的总容量:
按照平均每册书有300页来计算,每一页的大小约是35KB,一本书的大小是:35KB/页 x 300页=10500KB≈10.3MB。
那么,按照一所大学图书馆现有的藏书量80万册计算:
10.3MB/册 x 800,000册=8240,000MB≈8046.9GB≈7.9TB
几年后这所大学图书馆的藏书量会达到150万册,
10.3MB/册 x 1500,000册=15,450,000MB≈1,5087.9GB≈14.7TB
相关链接 采用光纤阵列SAN网络优势
网络连接采用SAN(存储局域网络)架构,保证系统的高性能。可在SAN网上任意增加存储设备,提高系统的存储容量;
系统采用全光纤磁盘阵列产品,保证系统的高性能;
所采用的磁盘阵列产品在结构上及硬件组成上完全是冗余设计(如阵列控制器、内部2条光纤环路、电源、风扇、链路控制器、双口光纤硬盘等),不存在单点故障,确保整套系统的安全运行;
磁盘阵列可采用不同的RAID保护级别,保证用户的不同需求;
存储系统,可提供高可扩展性,可在线扩容,有很好的投资保护;
所有硬件均可支持热插拔,保证系统应用的连续性;
系统升级不必停机,可在线升级;
系统具有良好的开放性,不同厂家产品之间能够互连。系统支持多种主机系统及集群系统;
系统安全性很高,可根据用户的要求,完成数据的隔离或共享;
可通过增加应用软件来支持物理通路的冗余连接,以提高系统的安全性;
可提供远程容灾功能来防止意外灾难引起的数据丢失;
存储产品采用基于Windows的图形治理界面,维护简单。
解决方法
以光纤阵列为主的SAN网络
1、基础方案
通常数字图书馆第一阶段的实际需求不会很高。一般情况下,采用容量为3~6TB的光纤磁盘阵列,基本就可以满足初期需要。整体SAN网络核心结点可以采用中档光纤交换机产品,如Brocade SilkWorm3200。服务器通过两条FC通道与交换机连接,达到单机双工的要求。这样的设计是为以后扩容做预备。(如图1所示)
2、扩展方案
扩展方案是在基础方案的基础上搭建起来的,核心结点可以由两台中档光纤交换机产品或一台导向器级光纤交换机产品。
这里,以前者为例,每台服务器通过两块光纤通道适配卡(HBA),两条光纤线路分别接入到两台交换机上,提供线路冗余;光纤阵列提供两个主机接口,它们分别接入到两台交换机上,以提供线路冗余和提高性能。这时,可将数字图书馆的主存储光纤磁盘阵列容量提高到10TB以上,以将客户图书馆的所有藏书的电子版及各种视频、音频数据都存储起来。(如图2所示)