由于围绕数据恢复和数据保留的法律问题,以及其他利害关系越来越多且越来越严重,企业组织不得不对远程数据恢复解决方案进行仔细评估。
不幸的是,从市场上良莠不齐的很多灾难恢复解决方案中选择并不是一件很轻易的事情。企业必须从全局出发,仔细考虑能够想到的所有问题,包括目标环境、项目范围已经主要目标,以及事实解决方案相关的业务和技术风险等等。
灾备第一步:需求评估
当企业组织对灾难恢复需求进行评估的时候,必须考虑以下一些因素:法规以及遵从需求、内部和外部基础架构需求、执行的预算以及重现的成本、治理和人员成本以及可用性、对灾难恢复可接受的风险等级。
其中,决定基础架构需求是最为棘手的一个问题。首先,企业必须对他们想要保护的数据进行识别和定义。
为了获得准确信息,IT人员可以询问这样一些问题:什么是最要害的有时间性的数据?有多少数据?数据的变化频率有多快?数据存储在哪里、怎么存储的?是在一个单独的服务器上吗?是在一个单独的数据存储设备上吗?还是在多个服务器及存储阵列上?这些服务器是同构的,还是涉及到多种操作系统或者多个硬件提供商?您企业内部是否有适当的存储区域网(SAN)或网络附加存储(NAS)?是否有分支机构拥有要害数据?
随着公司企业对数据恢复的重要性以及数据恢复项目的范畴开始有了解以后,他们必然会对市面上的解决方案进行关注,并钟情于其中的这个或者那个。为了避免非凡重要的缺陷,我们建议大家应该非凡关注这些方案是否符合可扩展性、兼容性以及性能。
可扩展性是一个非常重要的考虑因素,不仅要考虑现有的网络规模,而且还要顾及到任何预期的增长。一套合适的灾难恢复解决方案必须能够随着企业的网络架构以及数据规模同步增长。
当然,灾难恢复方案与您现有服务器和网络的兼容性也是至关重要的。人们必须消除一些传统的观念,当谈到灾难恢复时,假如治疗不得当,可能会比原来的问题更严重。软件的兼容性问题会导致网络和服务器的中断或宕机、消耗IT资源、影响客户的信心以及忠诚度。在贯彻实施灾难恢复方案之前,公司必须对相关产品的兼容性问题做一个全面的理解。
性能是另外一个关注点。很多解决方案所需要的软件代理以及驱动程序可能会给服务器或者网络性能造成不利的影响。因此很重要的一个工作就是,确认所选择的解决方案不会降低现有系统架构的性能,并保持其运行在一个可以接受的水平内。
另外,现有的网络也应该能够支持所选择的方案。假如将一个严格为24×7环境设计的解决方案,部署到一个有计划运作的环境中,是应该能够实际解决这些问题的。
一旦目标环境明确了,接下来就应该确定预算需求了。企业组织不但应该为这样一个灾难恢复解决方案的初始成本做预算,而且还应该为诸如服务支持合同、软件升级以及硬件扩展等所带来的费用进行预算。
另外一个经常被忽视的昂贵成本是,维护灾难恢复方案需要的人力成本。越复杂的解决方案越需要更专业的技术和支持,所以实施大型灾难恢复的企业也应该考虑,是否有预算来引进咨询顾问,或者在必要的情况下对员工进行相关培训。
最后,企业还应该确定他们对风险的容忍度,这包括两个方面:数据的适时性(timeliness)以及恢复数据需要的时间。由于对当今灾难恢复方案的多个方面进行分析是一项特辛劳的任务,因此一些商业企业往往满足于“足够好”的风险情形。如:一些商业企业认为传统的备份解决方案就足够好,因为一旦出现灾难,可以从离线的磁带中读出数据,新的服务器马上可以上线,数据似乎也能及时地从磁带中恢复出来。
实际上,一个经过良好计划的、使用诸如磁带备份这样的传统灾难恢复方案的备份和恢复策略,需要几天的时间才能使公司完全从灾难中恢复,并且运行的也只能是相对近期的数据。假如这样的情形对您的企业来说已经足够了,那您就不需要考虑基于IP的灾难恢复策略。
另一方面,很多商业企业已经发现,基于IP的解决方案与使用磁带备份的解决方案具有相同的成本,但是一旦发生灾难,基于IP的解决方案却能够使企业马上访问到最近的数据。
基于IP的灾难恢复
基于IP的灾难恢复解决方案具有双重目标:确保数据实时地拷贝到远程站点;一旦需要恢复能够立即实现。很多商业企业也会发现,在大多数的灾难恢复解决方案中,会在成本、易用性、基础架构需求以及数据可靠性等之间有所折衷。
在当前这样一个动态商业世界中,灾难恢复技术面临很多挑战。现有的很多解决方案都是设计为数据改变是发生在确定的时间内(即早上9点到下午5点),而并不是基于24×7发生的数据改变。这也就意味着,这些解决方案在确定时间段之外将有可能是不起作用的。
具有讽刺意义的是,另外一个挑战正是来自数据存储方法的改善。随着操作系统和应用程序变得越来越复杂,使用了诸如日志这样的技术来确保数据在一旦发生巨大故障后是可以恢复的。结果是操作系统和应用程序在本地很好恢复,可是当解决方案的运行得不到目前操作系统和应用程序如何写入数据这样的指导时,恢复风险会存在于远程数据保护情形中。
为此,一些轻易导致恢复风险的数据保护解决方案使用了另外的数据恢复代理或驱动程序来避免这些问题,这些解决方案致力于解决很多核心恢复问题,然而却忽视了很多可能对恢复带来负面影响的边缘条件。另外,如同前面提到的那样,代理和驱动程序也可能对服务器或网络性能带来不利的负面影响。
在一个异构网络环境中,使用复杂的解决方案来应对网络中的每一种服务器类型,可能会需要灾难恢复产品和软件代理的复杂组合,这种方法不仅给解决方案增加了复杂性和成本,而且需要专门的专家队伍来治理存储和恢复。负责维护这些系统的IT专业人员必须对所用的每一种产品或应用学习一套全新的恢复技术。所以当谈到数据恢复的时间时,最简单的解决方案往往是最好的。
什么是复制?
复制这个术语在当今的灾难恢复市场是使用最为频繁的一个词语,经常被错误地用于指创建原始数据的备份到第二台设备上的所有技术。这给消费者带来了不少的混淆,似乎所有的解决方案执行相同的任务,并提供相同级别的数据保护。实际上,有很多不同的技术可以供用户选择,而其中的每一种技术都有自己的优点和缺点。
从最基本的定义来看,复制指得是一种使用软件来拷贝和修改数据、并能有效传输到远程地点的技术。传统上说,复制是通过诸如应用程序、驱动器或软件代理这样的外部手段来获得其数据。首先使用的一个技术叫做文件映射,现在一般被称为文件级复制。
该软件工作的原理是,通过对文件进行扫描来测定这些文件是否被改变,假如文件被改变,文件级复制程序就会等待该文件关闭,然后对该文件做复制,传送到远程站点。
显然,这种方法在对文件的改变比较少、关闭迅速的情况下是很有效的,但是当对文件所做的改变很多时,这种文件级复制就会变得效率很低。在拷贝完整的文件到远程站点时,文件级复制也会占用比平时更大量的带宽。而且还有一种情形文件级复制恐怕会彻底无效,那就是文件不会被关闭,或者文件只是在工作日结束的时候才关闭(这在数据库应用中是很普遍的),之后复制程序就必须在业余时间“赶上”这个工作。
另一种较新的复制形式是快照。快照技术与传统的备份有些类似,它使用一个代理来及时对单点数据拍照,并传输到远程位置。另一个术语——及时点备份通常与快照在使用上是同义的,本质上也是相同的技术。这种解决方法虽然在很多情况下都是有效的,但是随着文件数量以及文件改变量的增加,它们也会需要不断增加的大量的带宽。