进入2008年以来,世界发达国家掀起了一股研究开发数字化永久性科学数据管理系统的新浪潮。
早在上世纪90年代末期,欧洲科学家们就认识到了数据信息管理数字化的发展趋势,也正是由于他们的不断努力,无纸化办公、数字化存储的概念才开始逐步成为世人的共识。设想如果科技资料馆里不再一味单纯依赖纸张介质,将可减少大量木材资源消耗,信息材料更可不断更新,知识和信息的传递和保存也会变得更加容易,可谓一举多得。
数字化存储亦有隐患
目前世界各地的计算机软盘和硬盘里已然存储着数量巨大的电子信息数据,但当下技术所支持的电子储存介质寿命还不足以保证信息长时间的保存。电子文件的发展对电子文件的格式、元数据的封装及其管理都提出了更高的要求,但决定文档格式是否具有长久可行的存储优势,主要取决于文档是否具有开放性,就电子文档而言,开放就意味着共享,而另一个重要的问题是,与纸质存储材料相比,电子储存介质存储内容更容易扩散、保密性较差,况且有很多技术资料信息本身就十分敏感,不适宜使用电子存储设备大规模拷贝。
据英国《新科学家》杂志报道,欧洲原子能委员会的高能强子对撞机(LHC)正在日内瓦研制,如能成功,将可把欧洲原子能委员会近15年来积累起来的4亿5千万千兆(G)字节的数据分类录入,这样大的信息量如果换成CD来存储,则至少需要6亿4千万张光碟,大量原始数据将被转换为数字存储格式,这对于科学工作者来说无疑更易于检索和使用,而此后随之建立的网上数据信息库将至少使10万台授权联网计算机收益。
为了解决上述问题,早在2007年11月15日,欧洲原子能研究委员会、欧洲航天局、欧洲科学基金会、欧洲科学技术设施委员会、瑞典国家档案馆、德国普朗克研究院、法国国家空间研究中心、国际科技编辑协会、英国联合信息系统委员会等9家欧洲科研机构就曾在比利时布鲁塞尔召开专门学术研讨会,讨论创建一个专门机构来研究科研信息数据的数字化录入和保存问题。
三大挑战考验存储时限
信息挑战:信息时代,资料的更新换代非常之快。由于硬件环境所限,老化存储介质中存放的数据经常在一段时间后就不能再录入到新的信息存储系统中去。与法老时代的纸莎草或刻在岩石上的玛雅文字长达数千年的存储寿命相比,电子存储介质的存储时间可以说是不值一哂。当然,有的存储设备厂家宣称自己生产的电子存储介质产品采用特殊材料制成,可以安全存储上百年时间,但毕竟这只是厂家的一些宣传手段,并不足为信,真实情况是,大多数电子介质的寿命最长不超过30年。
技术挑战:海量数据资料的大规模数字化存储不光需要电子信息存储技术的发展支持,更需要研发专用的输入输出检测设备,每一台个人计算机上的科研数据和信息资料在联网之前都应该经受反病毒检测确保是准确无误和安全可靠的,因为大规模存储的信息资料库将来必然会在科学界、商界和政界广泛使用,如果信息不准确将有可能造成严重后果。美国心理学协会(APA)在这方面就做出了良好的榜样,由于按照资料可开放程度认真对待每一件资料查询,多年来该机构向社会提供的专业信息资料一向保持着良好的声誉和可信度。
资金挑战:英国《新科学家》杂志还披露,欧洲原子能委员会目前已经筹集到6100万欧元的初期研究预算基金,但未来新型对撞机的研发预算总金额高达65亿欧元,况且这还只是LHC主机的开发费用,并未包含其他的配套设施,因而欧洲科学界进一步开发电子化存储设备显然还面临着巨大的资金问题。
世界主要发达国家均在数据资料存储信息化的研发方面投入巨大。在美国,与欧洲项目相似的研究计划被列入到联邦科学基金为数不多的几项核心任务之中,其第一期项目5个子工程的启动资金就达到1亿美元之多;澳大利亚也于2007年10月建立了一个研究数据存储信息化的专门机构———澳大利亚国家数据服务中心,该组织将致力于在澳洲建立一个国家科技电子数据信息库以供本国科学家更好地进行科研检索。
虽然,信息资料永久性数字化存储目前还面临着诸多的难题,但我们相信在各国科学家孜孜以求的研究中,人们享受高速、便捷的信息检索服务的那一天终将到来。
本报记者 李钊 科技日报