5.4 分级存储的治理
存储实现分级以后,在线、近线与离线存储存放的数据价值不同,在同一级别存储内部(比如在线和离线存储),存放的数据也应该不同,实现每一级别内的"分级存储"。如何将各个级别存储中数据统一治理起来便成了最为要害的问题。
分级存储治理(Hierarchical Storage Management,HSM) 起源于1978 年,首先使用于大型机系统。近10 年来,HSM 被广泛应用于开放系统的Unix 和Windows 平台。
分级存储治理是一种将离线存储与在线存储融合的技术。它将高速、高容量的非在线存储设备作为磁盘设备的下一级设备,然后将磁盘中常用的数据按指定的策略自动迁移到磁带库等二级大容量存储设备上。当需要使用这些数据时,分级存储系统会自动将这些数据从下一级存储设备调回到上一级磁盘上。对于用户来说,上述数据迁移操作完全是透明的,只是在访问磁盘的速度上略有怠慢,而在逻辑磁盘的容量上明显感觉大大提高了。通俗地讲,数据迁移是一种可以把大量不经常访问的数据存放在磁带库、光盘库等离线介质上,只在磁盘阵列上保存少量访问频率高的数据的技术。当那些磁带等介质上数据被访问时,系统自动地把这些数据回迁到磁盘阵列中;同样,磁盘阵列中很久未访问的数据被自动迁移到磁带介质上,从而大大降低投入和治理成本。
HSM 应用也具备监测磁盘容量并在要害容量情况下作出反应的能力。这种软件经过配置后可以为某个卷设定一个最小的剩余空间,如20% 。
假如软件发现该卷的剩余容量已经不足20% ,数据就会被从该卷移动至备用存储介质。这样便可以立即释放空间,治理员也可以在今后有空闲时再来解决空间的问题。
由此可见,分级存储治理更多从降低成本、不影响数据应用效果的角度解决数据的存储问题。事实上,降低成本、提高效率已成为IT 厂商追逐技术进步的一个目标。近线存储就是这种进步的产物。伴随单盘成本的下降,近线存储市场渐热,有业内专家猜测,不久的将来,近线存储技术将取代数据迁移技术,用户将以模拟海量空间的、更为安全可靠的磁盘介质保存历史数据。而成熟完善的数据迁移软件技术将更为恰到好处的融入到近线存储设备中,为近线存储技术的发展起到推波助澜的作用。
5.5 信息生命周期治理
现在着重介绍与分级存储治理密切相关信息生命周期治理。
目前,许多厂商和用户都认为,数据是具有生命周期的。Legato 公司将信息生命周期划分为7 个阶段,包括了数据从产生直至灭亡的全部过程。具体为:业务需求、采集/组织、保护/ 恢复、复制/镜像、共享、迁移/归档、删除。
由于是一个"周期"的治理,因此,在这个周期的每个环节都要有相应的产品来满足需求,包括系统咨询、信息采集、数据保护、迁移、归档等等产品。在一定的时期,用户可能只会应用到其中的某个或某几个环节,但是,把整个信息系统作为一个整体来治理是一个必然的趋势。
信息生命周期治理(Information Lifecycle Management,ILM )是StorageTek 公司针对不断变化的存储环境推出的先进存储治理理念。
ILM 不是某个硬件或软件产品,而是评估和治理信息的存储方式。它教育客户平衡信息价值和治理费用,根据数据对企业生存的要害性以及企业发展带来的价值决定存储费用。信息从产生到使用直到灭亡,其全部过程都需要进行治理,因此,信息生命周期治理是用户发展到一定阶段的存储需求,只不过它是一种很复杂的需求,具体来说,就是如何建立一个更完整、更具有价值的信息系统,能够完全满足用户对于数据的以下五种需求:随时访问、按时间恢复、方便的共享、所有数据受到适当的保护以及按照一定的时间规定(比如法律规定)治理数据。
ILM 的核心是理解信息在其不同生命阶段中对企业的不同价值,帮助企业从战略高度来治理信息。那么,治理信息和治理存储设备有何不同?从治理设备的角度出发,CIO 会不切实际地期望不断降低存储费用,同时要求高性能。随着数据量的不断增加,可用的磁盘容量不断减少,企业不得不无计划、被动地增加存储,导致系统环境越来越复杂,难以治理。从治理信息的角度出发,企业会根据信息生命周期的特点,将其存储在与自身价值相符、并与拥有者所需要的交流方式和服务方式相符的不同层次的架构里,通过有计划、主动地增加存储,不断降低复杂性并增加整个存储系统的可用容量。
ILM 通过存储、保护、治理、集成四个组成部分实现信息治理费用与业务需求之间的平衡,从而达到降低企业的风险和费用的目的。因此, ILM 使企业实现了"适当的信息,在适当的时间,以适当的费用,存储在适当的设备上"。它从以下三个方面提升企业业务运营:
帮助企业治理不断发展产生的变化和碰到的困难,为企业降低风险;
提高企业的运行效率,降低运营费用,提高经济收益;
帮助企业更好地治理资源,在市场上具有更好的竞争优势。