原文地址:http://www.dostor.com/t/feature/2005-10-21/0002425443.shtml
以下就让 DoSTOR 为您阐述一下,用户对虚拟化为何迷惑,存储虚拟化究竟是什么,它能够做什么?
其实这三个问题是相互依存,环环相扣。
用户之所以迷惑,是因为有厂商既没有深入了解用户存储环境的错综复杂,亦未设计存储资源的逻辑流程,即着手制订了很多发展战略。更甚之,有人还模糊存储虚拟化实现方式与虚拟化支持服务之间的界限。例如,有虚拟化厂商着重强调虚拟化之外的附加好处和功能,如数据复制、存储空间充分利用、异构存储阵列整合等。但我们必须明晰的一个观点是,存储虚拟化只是实现这些目标的方法之一,而不是唯一手段和目的。
既然我们在阐述虚拟化,那在这些看似纷繁复杂的这些厂商产品背后必定有其共性,倘若要获知这样的共性,我们必须将存储虚拟化是什么与存储虚拟化能干什么区分开。
总的说来,虚拟化就代表着:这个技术可以实现从包含卷的物理磁盘中将逻辑 RAID 数据卷单独提取出。随后,从单一 RAID 提取出来而创建的存储空间都被全部分配给单一主机的单个逻辑单元数( LUN ),即整合成一个集中管理的虚拟存储池 。
在SAN环境下虚拟化技术 可以利用众多独立物理设备的多种 LUN 建立大型独立磁盘容量池。利用虚拟化,实现SAN资源整合,并随需动态分配存储,这是虚拟化的核心思想。其带来的好处如下:
动态调整 SAN 存储分配,而不会影响服务器(无需停机操作)。 将异构磁盘阵列虚拟成为一个集中化存储池。 就笔者的认知而言,多年以来, RAID设备的工作方式就一直都是从物理磁盘驱动器中提取 LUN ,主机服务器上的卷管理器(例如 IBM 的 SVC )则一直从 LUN 提取存储卷。早在二三十年前,为了将内存空间或者一串直连的物理磁盘组织成一个逻辑存储实体,以便于管理和访问,一些主机操作系统(例如 IBM 的 MVS )中就有了关于存储虚拟化的原型。而多年来 UNIX 系统中常用的逻辑卷管理( Logical Volume Manager ),同样也是典型的存储虚拟化工具,只不过这些虚拟化的概念并未广为重视而已。
近年来,全球数据存储量海量成长,到 2008 年,中国外部磁盘存储容量会达到 139415TB (IDC数据)。这个数据的背后就意味着数以万计的网络存储系统在运行。虚拟化的概念就是在这样的背景下,忽如一夜春风来,成为坊间广为熟知的用语。
虚拟化从所在最基础的层面,可以定义为在物理存储设备和 / 或低级逻辑存储设备之上,能够提供简化的逻辑存储资源视图的提取层。这种提取可以发生在主机或存储阵列中,也可以发生在 SAN 内部。
所有企业机构都有一些核心存储目标,即:
保证高品质业务数据的可用性。 最小化总拥有成本(TCO)。 满足业务需求的可伸缩性存储。 要实现这三个目标,虚拟化是不二法门。为了部署虚拟化战略,主机、网络/存储设备都需要第三方虚拟化软件。
在 SAN 体系结构,可以从三个级别上实施虚拟化。
主机级别:基于服务器的软件允许各台服务器将虚拟存储器作为物理设备进行寻址。 网络级别:通过所有结构组件实现 SAN 范围内的虚拟化。 存储级别:可以将虚拟容量池设定为虚拟磁盘,并提供给所连接的任意或全部主机。 需要注意的是,各个SAN存储子系统间的功能和容量差异很大。在确定合适的 SAN 存储子系统和配置时,首先是满足组织内每个使用者的应用和数据处理要求。
虚拟化在网络端实施虚拟存储的结构形式,包括带内(in-band)与带外(out-band)两种形式。
带内执行(例如对称),是指使控制和数据在同一条路径上;带外执行(例如非对称),控制和数据使用不同的路径。
带内解决方案非常依赖作为主机网络和存储池中间设备的硬件(虚拟化服务器)。所有事务处理都将通过该设备,因而会产生性能瓶颈,并使可用性复杂化。带内设施必须拥有“恢复”功能,否则,通过一组设施执行 I/O 就会产生单点故障。另外,由于不能集中管理这些设施,因而会产生多个管理点。反之,虽然带外解决方案可能会部署一些分布式硬件,以便处理元数据,但主要基于软件。数据直接从服务器传输至存储子系统,因此,性能和可用性都不会受到影响。利用带外或分布式体系结构,一般能够提供集中管理。
总之虚拟化实现异构存储整合;可以按需分配存储容量,对容量可以进行弹性扩展,实现存储的集中管理。用户可以根据成长的需要将不同的产品整合到存储环境中。这些显见的好处,在拨开虚拟化迷雾之后,用户必然欣然接受,虚拟化将获得真实的市场占有率。