这个世纪初,互联网几乎支配着IT业每一次创始计划,Y2K则激发起无数疯狂的行动,IT业正经历着几种新架构,创新无处不在。4年后的今天,我们看到互联网崩溃了,它度过了一段漫长的萧条时期,非凡是在技术领域,几乎所有的安全措施都有漏洞,并把人们对数据保护和灾难恢复技术的爱好带到了前所未有的高度。我不相信有哪位预言家已经预见到所有这些事件的发生,并事先想出了应对这些问题的正确方法。关于2004年的存储战略,让我们来看看用户和厂商都应该仔细考虑的一些最困难的问题,而贵公司又该如何应对。
必须大幅提升数据保护和网络访问的安全性
随着数据价值越来越高,对IT和存储基础设施进行保护已经变得比以前更加清楚和明确。过去十年来,存储基础设施越来越可靠,数据生命的新敌人可能不再是技术故障,如磁盘损坏、磁带无法读取、系统或服务器崩溃而出现的蓝屏或黑屏等。目前对数据最大的威胁来自那些存心不良之人,以及不断增多的环境灾难,风暴、火灾、电力故障、洪水、病毒、黑客、盗版、内部威胁、国外入侵、伪造的账户记录,以及文件被盗等,是大多数计算机停机和数据损失的主要原因。仅2003年中连续3个月,美国和加拿大部分地区遭受了几次严重的自然灾难,包括东北部电力中断、飓风Isabel和加州失控的大火等。不断出现的数据安全问题迫使各公司对现有IT安全系统进行大幅度昂贵的改造。
对于2004年,头号存储问题就是数据保护,而预算应该优先用于解决现有基础设施的薄弱之处。
存储治理部署未跟上存储设备增长的步伐
随着存储设备的数量和类型持续激增,存储治理的复杂性也呈非线性增长。在某些应用中存储设备年增长率达到40-70%,但是存储治理工具的部署却并没有跟上。存储治理的复杂性可以得到简化,如对某些应用构建NAS、对某些应用构建SAN、添加虚拟化软件、实施SRM(存储资源治理)、将块和文件存储系统统一到单一架构中,以及实施一些server-less(更少服务器)的存储治理功能等。所有这些方法都可以改善存储治理,但是成本较高,并且需要熟练的技术人员来实施才能获益。
由于几年来预算不断削减,许多公司完全没有充分的资源去填补存储治理的缺口,一些公司已经决定不去治理存储系统,而只是采用更省事的解决办法,即简单地添加更"便宜"的硬件。除非你是一个以大型机(z/OS、iSeries)为中心的公司,否则数据总量与实际所治理的数据量之间的差距会越来越大,并且预计2004年仍会继续加大。
所以在2004年,要考虑实施一两种存储治理战略,为贵公司赢得最大利益,而其它战略则留待以后实施。
广泛的互操作性目前尚未有真正答案
将近20年来,IT机构一直希望有一天所有的产品都能够实现互操作,而现实情况是,这个目标并不是越来越近。各个标准委员会不停地会面想达成一致意见,但厂商们却悄然无声地拒绝了太多的协定,因为他们害怕失去自己的价值主张或竞争优势。在互操作性方面取得的真正进步仍然是以一个厂商为中心,该厂商与一群关系密切的商业伙伴紧密合作(即提供一些API),但是真正开放的架构尚未可见。
因此在2004年要接受这样一个现实,那就是真正开放的系统还要等上好几年,并且厂商可能推出更专有的高价值解决方案。选择那些最有益于贵公司的方案,即使它们是专有的。
考虑那些能改变规则的存储技术(磁盘)
低成本磁盘子系统的使用正超过台式机。预计2004年将推出一种基于SATA的存储子系统,它要创建一种新的存储级别,称为MAID(Massive Arrays of Inactive Disks,大规模非活动磁盘阵列)。在MAID阵列中,磁盘只在需要时转动而耗电。假如这听起来有些类似于自动磁带库,只是磁盘代替了磁带盒,那么你的理解没错。
MAID概念利用了存储工业长期以来的观察结果,即大约"80%的存储操作是面向20%的物理存储"。非活动SATA磁盘的加电时间约为10秒钟。MAID提供了传统RAID数据保护能力,这是为获得SATA更高可用性所必须的。MAID并不适合所有的应用,但其目标却是对低活动性参考数据和固定内容数据进行备份/磁盘恢复。初期MAID的定价介于低成本SATA阵列和自动磁带库之间,这有可能改变磁盘定价的规则。
2004年,请评估那些能够大幅削减(削减幅度>20%)你现有存储TCO的新兴存储技术。
考虑那些能改变规则的存储技术(磁带)
传统磁带存储仍然面临着一些架构问题,其中包括:寻找数据的时间(磁盘以毫秒计,而磁带是以秒计)、磁带只支持顺序存取(磁盘则支持随机和顺序存取),以及磁带恢复数据的时间比镜像或复制磁盘长(磁带需要数分钟甚至数小时,而镜像磁盘一般只需几秒钟)等。
幸运的是,解决方案把磁带和磁盘都迁移到一个新架构中。先进的新型自动库是一些嵌入式磁盘阵列,它们是磁带库的前端缓冲区。磁盘存储是更低成本且更大容量的磁带库的高性能缓冲区,它可以处理以前来自磁带子系统的很多I/O操作。预先制订好的有关文件大小和使用模式的方案,会决定数据何时在磁盘和自动库之间直接进行迁移,而无须通过服务器。
因此在2004年,要考虑将现有的自动磁带库升级为结合嵌入式磁盘阵列的系统,从而提升备份、恢复、固定内容和归档数据的性能。
磁盘和磁带存储厂商需要在容量和性能两方面提供可扩展能力
磁盘和磁带驱动器供给商一直关注着不断地提升容量,结果系统扩展了容量,而性能却成为制约吞吐量的瓶颈。由于磁盘驱动器容量的增长速度大于其性能,对大容量磁盘的利用会不断下降,以便减少对设备的争夺并维持一定的性能。大容量磁盘削减了硬件每GB的成本,但同时也造成了性能瓶颈。今天的磁盘驱动器可容纳最高320 GB的数据,而且会在以后的3-5年内超过500 GB,不过这一趋势最终会变得缓慢。磁带盒的发展目标现在是1 TB以上,而且随着容量的增加,磁盘和磁带的性能也要相应提升,这是势在必行的。
2004年,由于厂商继续在更高容量设备上提供每GB更低成本的存储系统,用户应该坚定一点,即性能要随着容量增加而提升。
智能存储网络
新存储网络架构的中心将是今天网络交换机、控制器和路由器的未来一代产品。一种先进的容错存储交换机架构(有时被称为存储域控制器 [Storage Domain Director]),正显示出对分布式存储资源进行集中外向型治理将成为现实。智能存储网络或交换机fabric的主要目的之一是大幅降低存储治理联系点的数量。许多类型的存储治理应用都可以作为存储网络中的主要应用,这其中包括控制SAN数据流、存储整合、SRM、HSM、备份/恢复、快照拷贝、复制,以及磁盘和磁带子系统之间的数据迁移(server-less功能)等。
尽管对于在哪里设置存储功能一直争论不休,但大家都普遍认为必须让存储治理独立于所连接的服务器之外。许多公司现在正在开发基础组件,构建智能fabric块,但是完整的系统还需再等上几年。
2004年,请密切关注智能存储网络或交换机fabric在发展过程中出现的新组件,这也许能为你填补不断扩大的存储治理鸿沟提供最好的机会。
了解你的数据:数据生命周期治理
了解数据一生的情况正成为有效治理数据的重要部分。数据是要害任务型、是重要的、敏感的,还是非要害型的?每种数据都有其最理想的备份/恢复和对可用性的需求。假如数据是大多数公司最有价值的资产,那么为什么我们对它知道的如此之少?
数据的再使用概率一直是理解数据最佳存储位置最有意义的衡量标准,也一直是令HSM(分组存储治理)系统更有效的重要前提。几乎对于所有的数据类型,访问次数都会随着数据老化而衰减,数据越老访问频率越低,这是25年多来HSM的根本思想所在。然而数据价值会随其老化而衰减这一通常的设想已经不再正确。
当近线(Nearline)存储概念于20世纪90年代得到广泛接受时,人们一般认为归档状态是数据被删除或寿终正寝之前最后一个阶段。15年后,游戏和规则都有所不同,关于数据传输和保存的政府新法规改变了数据在不断老化时被治理的方式。数据的生命后期正在延长,而不是象以前一样会萎缩。保存策略则更有效地根据数据价值和法律法规的要求而制订,而不仅仅基于访问频率,这就要求必须推出一种通用而标准的数据分类法。我们已经熟悉到所有的数据并不是生来平等的。
为了让数据生命周期治理策略更具成本效益,经常会采用两级或三级存储,这其中包括一级存储,即把高度活跃的数据或者至少每月都会访问的数据总是存储在磁盘中;二级存储则是对企业系统采用虚拟磁带,或者对那些较不活跃但尚未到达归档状态的数据采用SATA磁盘系统;第三级存储则是长期存储,这仍然是磁带库的领域。将大量数据在各存储级别中移上移下并且在服务器中移入移出,是达到设备至设备的数据传输能力所必须考虑的问题。
所以2004年的战略之一是,要继续根据数据对公司的重要程度和价值对其进行分类,然后实施能够满足这些需求的最理想的存储解决方案。
实施以价值为导向的标准来决定真正的价值
现在大多数用户仍把硬件采购价格作为最主要的采购标准,这已经越来越不合时宜,也反映出一种过时的观点,即硬件是IT基础设施的价值所在,这就象用销量(老规则)而不是电视所传输的内容的价值(新规则)来衡量电视业的价值一样。每年硬件的价格都会下降35-40%,所以存储工业的价值也从原子级转向比特级。
2004年我们要承认,最低的价格也许并不是最好的解决方案,而且可能最终成本更高。要选择一种整体价值最理想、ROI(投资回报)最佳或TCO最低的解决方案。