在憧憬存储未来的前景时,每位专家都有不同的出发点,也会与自己的企业正在进行的工作密切相关,所以为了对存储的未来有一个全面的了解,让我们听听来自存储不同研究分支的专家对存储未来的描述。
美国Pace大学信息系统副教授James Gabberty——
在线存储的急剧增长将催生一个全新的职业——企业数据治理员。他们将能弄懂公司所有工作人员产生的数以百万计的数据,把它们变成实用的、可搜索的知识库,从而消除现在这种数据混乱的状态。
美国Northrop Grumman公司Winchester Electronics部总裁Michael Driscoll——
CD、DVD、闪存和软盘用不了几年就会被淘汰。无线访问速度急剧增长,人们通过无线方式访问Internet数据,将像今天通过磁盘驱动器访问一样快。现在人们可以在世界上任何地方使用蜂窝电话联络,将来则能够在世界上任何地方访问个人或企业数据。本地存储或将数据复制到便携式存储介质上的需求将不复存在。
美国Colorado软件架构公司总裁Dave Howard——
到2007年,将广泛提供具有全面保护功能的版本化文件系统。所谓版本化,即答应用户或应用程序回到以前任何一个时间的文件状态。例如对数据库而言,可以轻易地回到上个月末,运行一份那时的报告。而台式机用户不用制作备份就可以回到以前任意版本的文件,或受病毒感染之前的文件。从本质上来看,未来的文件系统将具有固有的自愈能力和防病毒能力,并消除了备份需求。
美国M-Systems闪盘先驱公司营销负责人Dana Gross——
由于闪存芯片和多级存储单元技术的不断进步,预计到2007年蜂窝电话将使用上万亿字节的数据存储产品。
美国BlueArc公司首席技术官Geoff Barrall——
到2005年数据迁移将成为数据存储领域最大的问题之一。到那时,存储设备将能容纳数百万亿字节数据,硬件升级或向第二场所迁移数据所需的时间会让人望而却步,经常需要几周甚至几个月的时间。这会极大地刺激零停工时间数据迁移工具市场的发展,以及能刺激从其他硬件镜像或迁移数据存储系统的发展。
美国Contoural公司总裁兼CEO Mark Diamond——
在未来3年里,几乎所有上市公司都将建立企业数据档案。为了遵循复杂的法规和满足查找要求,一些公司将会把几乎所有东西都存储在廉价存储系统上的集中式企业数据档案中。集中式档案将包含ERP数据、电子邮件和文件的副本,对这些档案的治理和检查也是集中式的。这些档案将像今天的防火墙一样无处不在。
美国3ware公司副总裁Barbara Murphy——
存储厂商太重视企业数据存储市场了,以至于忽视了娱乐业这类非传统市场中存储需求的增长。想想看,在下一个10年当中,越来越多的电影将是数字的,一两个小时的电影将需要800TB的存储容量。光是电影行业的数字化就将产生数百万万亿字节的数据,这远比今天整个企业存储市场大得多。
Critical技术公司CEO Scott Klososky——
未来两年,代理程序或自动服务程序将被广泛用于挖掘企业数据,以洞察发展趋势,实施商业智能。例如代理程序可能能够挖掘所存储的电子邮件,看雇员是在与竞争对手联系、行为不轨,还是在做一些积极的事情。假如你在治理银行的借贷部工作,那么就需要及时了解所有超过30万美元的贷款。雇员将拥有一个接口程序,借助这个接口程序编制代理程序即可进行实时搜索,然后在弹出窗口中显示搜索结果。
美国OuterBay技术公司CEO Michael Howard——
数据库没希望了。2004年将开始出现来自存储厂商的新型智能文件系统,这些系统利用自描述和自适应技术,因此避免了数据库的复杂性和性能负担。这种趋势的核心为,描述数据不是按照行和列而是将其作为可在文件容器中访问并治理的业务目标,应用程序可直接访问数据。这种方法有时称为基于目标的存储。未来两年内,这种智能文件系统将会普及开来,并在未来三年内侵蚀数据库厂商的收入和它们在客户心目中的位置。智能存储系统将取代数据库进行简单搜索和检索。
TransQrbital公司总裁Dennis Laurie——
TransQrbital公司是一家希望把去月球的旅行变成平常事的商业公司。我们计划在月球上为公司客户提供远程存储服务,以保护要害数据不受地球上的自然或人为灾难的破坏。第一步是2005年把一个原型服务器送上月球,接下来在第二、第三和第四次行程中送去一些更大的服务器,直到月球上有一个服务器群为止。发送和检索数据将会比较麻烦,因为有3秒钟的传输延时。但是现在Jet Propulsion实验室的一种协议有可能解决这个问题。
小资料:串行存储获宠
多年以前,所有发送到磁盘的数据和来自磁盘的数据都以串行方式传输,一比特一比特地发送,只采用一个通道或一条线缆。存储在磁盘上的数据由1和0组成的长串(称作磁道和扇区)构成。磁头每次1比特地读取这些信息串,直到驱动器累积到了预定的数据量,然后把它们发送到处理器、内存或其他存储设备。驱动器如何发送这些数据将影响到总体性能。
然而,有了集成电路以后,可以方便便宜地把多个器件放在单个硅芯片上,于是产生了并行接口。 一般地,并行接口用8个通道进行传输,答应同时发送8个比特(1个字节),这就比直接串行连接更快。
那为什么当需要更快地在磁盘上读写数据时,厂商却放弃了并行接口而选择了串行接口呢?例如,大部分打印机甚至不再使用并行端口。膝上型电脑放弃了传统的并行和串行端口,采用更高速度的通用串行总线(USB)和IEEE 1394端口。我们现在能在连接磁盘驱动器的接口上看到同样的转变。
乍一看,这似乎是违反常理的。但以目前的传输水平,串行传输比并行传输速度快,而且并行传输有以下几个缺点:
处理负荷大
并行传输为了方便而采用字节,但是一个字节是8个比特,最后还是要分别处理每个比特。这样在把一个字节并行发送到磁盘驱动器之前,必须先把8个比特排列好,把每个比特送入不同的线缆。当这些处理完成之后,开始发送这一字节。在电缆的另一端,当驱动器接收这些比特时,必须经过相反的过程把这一字节转换为串行比特流,这样磁盘驱动器写磁头才能把它们写入磁盘。
可以用另一种方法想像一下这个几乎完全相反的并行与串行转换的过程。例如在电报线路上发送莫尔斯电码,信息开始是作为一张纸上的许多单词出现的(并行)。处理器(即操作员的大脑)必须把每个字母转换为一系列的点和线(串行),然后通过电线发送。
在接收端,另一个处理器接听这些串行的点和线,然后把它们转换回字母和单词。在这一过程中需要很多处理开销,因为传输介质与最初的输入或需要的输出不匹配。
信号时滞
当信号通过一根电线或一个集成电路时,电线或集成电路的非理想性会延迟一些比特。
在并行方式中,同时离开的8个比特可能不会同时到达另一端;其中一些会迟于其他比特。这被称做时滞。为了解决这一问题,接收端必须与发送端同步,必须等到所有的比特都到达才行。处理的顺序是:读取、等待、锁存、等待时钟信号、发送。
电线数目越多,距离跨度越大,就会有更大的时滞和延迟。这种延迟限制了实际使用的时钟速率以及适用的并行线缆的长度和数目。
串扰
并行线缆在物理上是捆绑在一起的,这意味着一个信号有时可能会把自己“印记”到与之相邻的线缆上。当然只要信号清楚,就不会产生问题。
但是当比特相邻更近、信号强度随距离衰减(尤其是在较高频率时)和中间连接器导致杂散反射累积时,错误概率就会明显增加,并且磁盘控制器无法分辨1和0。这就需要额外的处理以防止此种情况的发生。
串行总线可以通过在传送的时侯修改信号进行预先补偿来避免上述情况。在串行方式下,所有的传输路径都被很好地控制,与并行方式相比,串行传输能以更高的频率可靠地进行。
更新、更小的串行接口
我们已经看到在打印机及其他外设上串行连接取代了并行连接。现在,在计算机内部,我们正在使用Serial Attached SCSI、Serial ATA等更新的串行结构替代磁盘驱动器和阵列的并行连接。
并行方式使用的大连接器和很宽的带状电缆会堵塞电脑内部的气流,而小的串行线缆粗细与电话软线类似,并且新的电源连接器能把15个插脚放到旧设备的4个插脚里,这都会使计算机的内部更加整洁。
与此同时,在机箱内部连接其他设备的PCI正在被PCI EXPress串行接口代替。
其他与存储有关的串行系统接口还有Serial RapidIO、InfiniBand和光纤通道。(何娴/文)