新兴的Internet数据库
发布于:WWW.WFCN.Net 发布日期:2004-11-18 浏览次数:121
数据库技术自20世纪60年代诞生以来,为计算机收集、存储、加工和利用数据提供了全面的支持,并起到了十分关键的作用,已经成为当今计算机信息系统的核心技术,是计算机技术和应用发展的基础。围绕着数据结构和模型的演变,传统数据库技术相继经历了网状数据库、层次数据库和现今的关系数据库3个阶段。但是,随着Internet的发展和普及,关系数据库由于其局限性,越来越不能适应人们的需求,市场逐步萎缩,而一种基于Internet应用的全新Internet数据库正在迅猛崛起。
关系数据库的现状
---- 在70年代发展起来的关系数据库凭借完备的理论基础、简洁的数据模型、结构化的查询语言和方便的操作方法,在全球信息系统中得到了极为广泛的应用,基本上满足了企业对数据管理的需求,所以目前世界上大部分的数据都是由这种数据库系统来管理的。虽然随着计算环境的变化,关系数据库技术也在进行相应的发展,但始终未脱离关系型技术。
---- 然而,随着数据库系统的日益普及以及人们要求的不断提高,以网络为中心的企业级快速事务交易处理的应用需求,使关系数据库开始不断地暴露出它的局限性。其中特别突出的是关系数据库关系模型过于简单,不利于表达复杂的数据结构;而且关系数据库支持的数据类型有限,无非是结构化的数字或字符,无法包容更多的数据类型。因此,面对随着 Internet飞速发展而涌现的大量非结构化的数据类型,如图形、图像、声音、大文本、时间序列和地理信息等复杂数据类型,传统的数据库系统无法或很难描述这些数据类型, 对此类数据处理也只是停留在简单的二进制代码文件的存储,就更谈不上实现对这些数据的查询和检索了。在Internet成为计算的核心平台后,关系数据库更受到来自Web上数据库应用开发、Web 内容管理以及电子商务等各个方面的重压,并在安全性、可管理性、丰富的多媒体数据的处理以及响应时间、易用性等方面遭遇严峻的挑战,传统关系数据库已经越来越无法适应现代信息系统应用开发的要求。于是在网络应用的推动下,关系数据库开始发生进一步的变革,面向对象的数据库、Internet数据库和多媒体数据库相继涌现,这种现象也有人称之为“后关系数据库时代”。
---- 从这几年数据库市场上的数字也可以看出,关系数据库正逐渐衰落。1997年,全球数据库市场就开始增长缓慢,增长率仅为7%,大大低于同期20%的软件市场增长率。1998年和1999年数据库产品在国际市场上则连续出现负增长。然而令人遗憾的是,由于国内应用人员对新技术认识不够,使传统关系数据库在我国仍大行其道,大量的单位和人员仍在利用传统的数据库产品开发面向新的、以Internet 为基础的应用。可喜的是,随着新数据库技术和产品的涌现,一些用户开始转向基于Internet应用的数据库产品。例如,国家计委内部网、中国价格信息中心都相继选择了国信贝斯公司推出的iBASE非结构化Internet数据库,用于支持新的Web应用的信息系统。
Internet数据库应运而生
---- 在全球网络化大潮汹涌澎湃的今天,Internet已经逐渐替代以个人计算机为计算中心的单机运行环境而成为新的计算平台标准。以Internet 为核心的计算平台使数据库应用环境发生了巨大的变化,于是基于Internet/Web的应用向数据库领域提出了前所未有的挑战,并对数据库本身的存储机制、空间使用的效率以及安全性等方面都提出了更高的要求。而在这种新的应用环境下,传统关系数据库简单的2D表格结构已经远远难以满足应用需求。
---- 在Internet数据库的访问上,传统的关系数据库厂商是通过将Client/Server结构扩展为Web服务器、应用服务器和数据库服务器来实现基于Internet应用的数据库信息系统。与传统的数据库信息系统相比,这种结构虽然具有一定优势,但是开发难度大,效率低,安全性较差,而且要求开发者熟悉CGI标准、数据库接口和SQL语法等。此外,由数据库返回的数据库结果集经CGI转变为HTML格式后,其数据量至少扩大1倍,增加了网络的数据传输量。这对于我国的广域网来说,更是一个沉重的负担,因为这不但增加了用户的费用,也使网络的整体效率大大降低。同时,由于Internet的内部传包机制,Internet用户发送的数据包所经过的路由很难预先确定,加上Internet上数据都是以HTML形式传输的,因此任何一个网上节点都可能是一个不安全的因素。这就是传统关系数据库在基于Internet应用上的难尽人意之处。
---- 为了解决上述问题,顺应Internet发展潮流,必须开发非结构化的Internet数据库产品,融当今最先进的网络技术、数据库技术、存储技术和检索技术为一体,完全基于Internet应用的数据库结构和模型,成为真正的“Internet数据库”。
---- 所谓Internet数据库,其实质是在传统关系数据库技术之上,融合最新网络技术、存储技术和检索技术的发展。它结合了传统数据库技术的一些优点,在数据库模型、存储机制和检索技术等方面做出革新,以全面面向Internet的功能结构来适用于新的以Internet为基础的应用,从而开辟了一个Internet 数据库的新时代。
---- 面对Internet 数据库庞大的基于Internet应用的市场机会,传统的关系数据库厂商也相继做出反应,对原来的传统关系数据库产品进行改进,增强了面向Internet和多媒体方面的功能,推出基于Internet环境下应用的数据库产品,它们在传统关系数据库的基础上通过提供中间件、Web服务器开发环境、编程接口、管理工具、专用Web服务器与浏览器等一整套方案,也实现了数据库基于Internet的应用,达到传统关系数据库向Internet数据库的转换。但表面的改进并没有改变关系模型底层的2D表格结构,除非用户能在价格昂贵的硬件上大量投资,否则传统关系数据库仍然无法达到Internet数据库的性能。因此,随着以网络技术和数据库技术为支撑的电子商务的进一步发展,融合这2种技术的Internet数据库有希望成为未来市场的主流。
Internet数据库的特点
---- Internet 数据库的主要特征是采用字表多维处理、变长存储以及面向对象等新的网络技术和数据库技术,使数据库应用转为全面基于Internet 为基础的应用。一方面,Internet数据库采用字表多维处理方式支持包括结构化数据以及大量非结构化的多媒体数据等更多类型的数据,使组成用户业务的各种类型数据能够存储在同一个数据库中,从而让执行复杂处理的时间大大缩短。另一方面,Internet数据库支持ActiveX、XML等新的编程技术工具,能够支持和快速开发越来越复杂的事务处理系统应用程序,简化系统开发和管理的难度。
---- 在数据库结构上,为了支持新一代Internet数据库应用,数据库系统需要支持复杂数据类型,如图像、视频对象、声频对象、时间序列等以及相应的数据操纵语言,Internet数据库应采用子字段、多值字段以及变长字段的机制,允许创建许多不同类型的非结构化的或任意格式的字段,以多维处理方式突破了关系数据库非常严格的2D表结构,并具有独特的变长存储方式。同时,它还突破传统关系数据库的访问方法,包括索引机制和查询机制,采用B*树倒排索引技术,支持目前几乎所有的索引方式;并采用布尔逻辑检索方式,支持包括全文检索在内的复杂检索方式,具有关系数据库不可比拟的查询速度和查准与查全率。更重要的是,将非结构化和结构化数据都定义为资源,使得非结构数据库的基本元素就是资源本身,而数据库中的资源可以同时包含结构化的和非结构化的信息,所以,非结构化数据库能够存储和管理各式各样的非结构化的复杂数据。通过这种对资源的管理方法,非结构化数据库实现了数据库系统从数据属性管理到内容管理(ICM)的转化,从而为管理复杂的网络数据奠定了坚实基础。
Internet数据库前途无量
---- Internet的迅猛发展带来网络经济的浪潮,通过Internet开展电子商务已经成为世界经济发展的方向。Intel公司总裁贝瑞特曾经说过,未来将不存在网络企业,因为所有的企业都是网络企业,将来不上网的企业只能等死。目前,用户构造基于Internet应用的需求在迅速增长,而Internet/Intranet/Extranet的应用都为Internet数据库带来了一个全新和庞大的市场机会。因为电子商务、Web 医院、远程教育、数字图书馆、移动计算等各个领域都需要新的Internet数据库技术的支持。随着我国网络信息化建设的进一步推进和企业信息化进程的加快,将会有越来越多的用户开展面向Internet的应用,政府机构、证券、金融、教育科研、交通、制造业以及运输等诸多行业都会给Internet数据库提供广阔的应用空间。