市场催生成熟的存储虚拟化
最直观的理解存储虚拟化,是在我们为应用分配存储资源时,不必关心数据的实际存取方式和位置,而这仅仅是功能上的需求。客户真正能够从中获益的,应当是异构的、层次化的、地理上分布的存储环境虚拟化,并且能够提供业务连续性和灾难恢复支持。
大量的应用需求在呼唤存储虚拟化技术的不断成熟,首先是来自硬件升级时盘阵间数据的迁移;其次是信息生命周期治理(ILM)以及层次化存储(Tiered Storage)架构设计趋势下的数据迁移;再有,大量异构环境下本地及远程的数据镜像,数据复制操作等等。对于应用而言,至关重要的是提供一个异构环境下的 “存储池”、集中简化的容量治理和分配(例如基于网络的卷治理功能),而这些都是基于主机或是基于磁盘阵列的虚拟化技术难以实现的。
目前市场上也出现了一些基于网络的存储虚拟化技术,VERITAS,Rhaposody,Cisco CSM/ASM,但为什么没有被市场广泛接受呢? 原因在于无法面对真实的存储环境,解决虚拟化后的性能问题,扩展性问题,和与现有环境集成等问题。
首先是性能问题。早期的虚拟化产品大都由软件完成SCSI/光纤通道间的地址转译,虽然解决了很多功能性问题。但性能很有限,只能虚拟几个通道,现在大的盘阵都可以扩展到几十TB以上,支持数十个通道。那么低性能的虚拟化产品所面对的,就只能是中低端存储环境。
基于网络的存储虚拟化应当可以应对大型的、复杂的存储环境(500-1000个网络端口,50-100TB)。这个时候我们所要做的存储虚拟化就需要很强的IOPS能力,也就是很好的性能输出,至少是上百万级别的。现在高端磁盘阵列已经可以提供上百万的IOPS,假如你希望在网络层次上做虚拟化存储,那么交换机的吞吐能力需要比磁盘阵列的IOPS的吞吐性能更高。这是一个挑战,而虚拟化存储必须考虑到性能处理方面的能力。
其次是扩展问题。存储网络的最大成功在于解决了存储的资源整合,实现无中断的扩展。虚拟化不应当成为扩展的障碍。
刀片式(Blade)的设计虽然解决了治理性问题,但单柜体内有限的背板带宽却限制了虚拟“存储池”的大小,同时指定槽位的设计也降低了虚拟“存储池”的可用性。
扩展的另一个问题是网络环境下的虚拟化。如其他存储网络提供商的虚拟化产品,只能虚拟直接连到交换机端口上的存储资源,而不能支持E_port网络互联形式的虚拟化。这种层次上的虚拟化实际意义很小,交换机只能互联很小规模的数据中心,互联三五台机器。一个高端盘阵就会有64个端口,而对于只具有16个端口的虚拟化交换机来说,就等于其虚拟化能力还远不如一个单柜体的磁盘阵列,就谈不上实际意义上的存储虚拟化。因此存储虚拟化就应当支持网络的虚拟化,应当支持E_Port互联,这样可以透过网络发现更多的存储资源,可以是高端导向器连接的数百个存储通道,也可以是边缘交换机所连接的众多小的盘阵,甚至可以是远端数据中心的容余磁盘阵列资源。
McDATA的存储虚拟化策略
McDATA认为基于网络的(fabric-based)存储虚拟化是解决异构、层次化、地理上分布的存储环境的最佳途径,它不仅能够提供了开放的系统架构,回避了基于主机或是磁盘阵列虚拟化技术所带来的投资风险,更可以解决存储资源的扩展性和复杂性。
存储服务的智能化是每一个高端存储厂商的核心竞争力,没有一个存储供给商愿意仅仅提供一个裸盘柜,挂接到一个高度智能的存储网络中。
McDATA巧妙地利用了独立路径架构(split-path architecture)的设计思路,统一了存储与网络供给商的利益,激发了各存储供给商将其核心的存储服务移植到网络中,共同促进存储虚拟化的进程。
企业级的可用性和可服务性需要各自独立的数据通路和控制通路,ESCON, FICON以及普遍采用的光纤通道协议均采用了独立路径的架构。基于该架构,McDATA只提供物理地址的映射、路径的优选功能,而数据存取的请求则由存储厂商的核心存储服务发起。这样,基于网络的虚拟化就分成两部分产品,一个是McDATA称之为快速通道存储处理器(Fast-path Storage Processor)的硬件芯片,另一个是开放给各OEM厂商和ISV伙伴的存储服务芯片。前者由于采用了硬件设计,能够充分保证性能输出,均可以提供单端口100万的IOPS,处理能力比目前市场上的产品高一个数量级。
为了与现有的存储网络环境集成,实现无中断的扩展,McDATA采用称之为导向器服务模块(Director Service Module (DSM) )的系统架构,上述快速通道存储处理器(FPSP)嵌入其中,在治理模式上类似于刀片式设计,单一治理实体降低复杂性,同时又可以像外部交换设备一样按需扩展。
趋势
随着性能、扩展性、可用性等问题的逐步解决,会有更多的大型企业用户会采纳存储虚拟化方案,但不排除主机、存储、网络三者结合的方式。
虚拟化的终极目标是聚合数据存储服务,包括基于策略的治理,SRM,ILM,并可提供存储效能模型。存储虚拟化的大量普及还将依靠于新的应用,如自动执行基于策略的操作替代目前的手工作业,这都将依靠于存储行业的进一步发展。