给数据上份保险
天堂和地狱永远只有一墙之隔。当企业因为信息化带来快捷的服务决策和方便管理时,也必须面对着数据丢失的危险。数据的丢失会中断企业正常的商务运行,造成巨大的经济损失。对电信行业来说,数据的安全尤其重要,其数据不仅是企业发展的资源,而且也是为用户服务的关键依据。同时,电信的拆分和外部的经济环境也加剧了电信的竞争,如何为用户提供全面及时的通讯保障也对电信IT系统提出了高可用性和高可靠性的要求。
电信业的大部分业务必须依赖于数据处理。数据是否安全成为了电信的命脉。如果没有了数据,电信业务将全部处于瘫痪状态。如果电信的计算机系统非正常停止运转,除了造成巨大的经济损失外,更为重要的是,有可能会失去用户的信任以及一系列赖以生存发展的市场。
在现代复杂的商业环境中,对电信行业来说,其关键业务不允许出现哪怕是1%的灾难威胁,因为建立容灾系统势在必行。VERITAS认为:建立容灾系统的目的不是备份,而是恢复。根据Disaster Recovery Jounal的调查表明,在受到灾难袭击的5个公司中,将有2个公司无法从灾难中重新开始工作。而那些即使是重新开张的公司中,也将有至少1个将在两年后关张。灾难恢复的成功与否决定着灾难袭击后公司的生存与否。不但将给企业带来巨大的经济损失,而且还会影响企业的声誉,降低企业的竞争力。
从灾难发生的原因来分,主要有两种类型:自然灾难和人为灾难。自然灾难主要包括:飓风、龙卷风、地震、洪水、火灾等。人为灾难是指人们在平时可能意识不到的灾难,它潜伏在人们的日常工作过程中,是对IT架构及其相关组件操作、运行过程中积累下来的灾难,它包括计算机/网络犯罪、计算机病毒、掉电、网络/通信失败、硬件/软件错误和人为操作错误。
从广义上讲,任何提高系统可用性的努力,都可称之为容灾。但是现在人们谈及容灾往往只是针对慢性容灾而言。在系统设计中,企业一般会考虑做数据备份和采用主机集群的结构,因为它们能解决本地数据的安全性和可用性。这是针对慢性容灾的本地解决方案,如果当某台主机出现故障,不能正常工作时,其他的主机可以替代该主机,继续进行正常的工作。目前人们所注意到的容灾,大部分也都只是停留在本地容灾的层面上。但是作为电信部门来讲,光有本地容灾是远远不够的。其关键业务应用,如计费系统,客户服务系统,运营帐务系统等,必须要防范地震、战争等自然灾难。因此电信业应该采用异地容灾的保护措施。
一般来说,为了保护数据安全和提高数据的持续可用性,企业要从RAID保护、冗余结构、数据备份、故障预警等多方面考虑。因此一套完整的容灾方案应该包括本地容灾和异地容灾两套系统。对于电信行业来说,更是如此。
一切从备份开始
在今天的经济环境下,大部分厂商和企业都认识到了数据安全的重要性。但在如何保障数据的安全上,有人认为:数据复制就是容灾,只要把数据复制了就万无一失能够应付任何灾难了,也有人认为:建立了一套容灾系统就不用备份数据了。实际上,数据备份是容灾的基础,一切容灾系统的建立都是以数据备份为基础的,但是仅有数据备份是远远不够的。那么,什么是全面的容灾方式呢?专家指出,全面的容灾方式应该是备份+数据复制+远程容灾.特别对电信行业来说,其计费中心,客户服务系统,运营帐务系统等关键业务应该实施多种备份以防止灾难。
数据备份,只是指为防止系统出现操作失误或系统故障导致数据丢失,而将全系统或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的过程。传统的数据备份主要是采用数据内置或外置的磁带机进行冷备份。早在1990年,VERITAS就开始采用这种方式为用户提供数据解决方案。但是这种方式只能防止操作失误等认为故障,而且其恢复时间也很长。随着技术的不断发展,数据的海量增加,不少的企业开始采用网络备份。网络备份一般通过专业的数据存储管理软件结合相应的硬件和存储设备来实现。
目前比较常见的备份方式有:1.定期磁带备份数据。2.远程磁带库、光盘库备份。即将数据传送到远程备份中心制作完整的备份磁带或光盘。3.远程关键数据+磁带备份。采用磁带备份数据,生产机实时向备份机发送关键数据。4.远程数据库备份。就是在与主数据库所在生产机相分离的备份机上建立主数据库的一个拷贝。5.网络数据镜像。这种方式是对生产系统的数据库数据和所需跟踪的重要目标文件的更新进行监控与跟踪,并将更新日志实时通过网络传送到备份系统,备份系统则根据日志对磁盘进行更新。6.远程镜像磁盘。通过高速光纤通道线路和磁盘控制技术将镜像磁盘延伸到远离生产机的地方,镜像磁盘数据与主磁盘数据完全一致,更新方式为同步或异步。
那么,数据备份的目的是什么呢?其关键是在于保障系统的高可用性,即操作失误或系统故障发生后,能够保障系统的正常运行。因此,企业不会只单独购买备份设备,还会装备将其备份数据从介质转移到系统的设备。这样,数据备份才有意义。
因此,仅仅进行数据备份是远远不够的。容灾系统必须要考虑到系统恢复的问题。现在不少企业也意识到了这一点,采取了系统定期检测与维护、双机热备、磁盘镜像或容错、备份磁带异地存放、关键部件冗余等多种灾难预防措施。这些措施一般能够进行数据备份,并且在系统发生故障后能够进行系统恢复。但是这种一般的措施只能处理计算机单点故障,对区域性、毁灭性灾难则束手无策,也不具备灾难恢复能力。
因此对于电信行业来说,仅有这些措施还不够,其关键业务必须实施远程容灾保护。远程容灾系统具备应付各种灾难特别是区域性与毁灭性灾难的能力,具备较为完善的数据保护与灾难恢复功能,保证灾难降临时数据的完整性及业务的连续性,并在最短时间内恢复业务系统的正常运行,将损失降到最小。其系统一般由生产系统、可接替运行的后备系统、数据备份系统、备用通信线路等部分组成。在正常生产和数据备份状态下,生产系统向备份系统传送需备份的数据。灾难发生后,当系统处于灾难恢复状态时,备份系统将接替生产系统继续运行。此时重要营业终端用户将从生产主机切换到备份中心主机,继续对外营业。
灾难恢复不是梦
容灾,对于IT而言,就是一个提供能防止各种灾难的计算机信息系统。当政府、企业、商家的核心计算机系统在遭受如:火灾、水灾、地震、战争、人为破坏等不可抗拒的灾难和意外时,能够及时恢复系统的正常运行。因此,容灾的目的在于及时恢复系统运行而不在于数据复制。
复制,顾名思义就是将数据库中的数据拷贝到另外一个不同的物理点上。数据复制技术是容灾系统的核心。数据复制,主要有同步数据复制和异步数据复制两种。
同步数据复制,指通过将本地生产数据以完全同步的方式复制到异地,每一本地IO交易均需等待远程复制的完成方予以释放。异步数据复制则是指将本地生产数据以后台同步的方式复制到异地,每一本地IO交易均正常释放,无需等待远程复制的完成。
同步复制实时性强,灾难发生时远端数据与本地数据完全同步。但这种方式受带宽影响较大,数据传输距离较短。异步复制不影响本地交易,传输距离长,但其数据比本地数据略有延迟。在异步复制环境中,对于所有应用最关键的就是要确保数据的一致性。那么企业究竟应该如何选择复制的方式呢?一般来说应该结合自己的备份方式和容灾方式来考虑。对于电信行业来说,应该两种方式接合采用,这样才能保证其关键数据万无一失。
在数据复制的同时,还需要管理软件对数据复制状况进行动态监测。目前一般IT厂家都提供了远程动态监测软件,当主机/应用发生故障时,会马上监测到,将故障情况向管理员报警,然后根据策略自动或手工快速地将应用进行切换,确保复制数据的正常进行。VERITAS的Volume Replicator (VVR)就是通过广域网远程连接,采用可靠的连接和监听协议,保证远程备份站点与本地逻辑卷数据的一致性。
数据复制对数据系统的一致性和可靠性以及系统的应变能力具有举足轻重的作用,他决定着容灾系统的可靠性和可用性。那么企业究竟搭建什么样的容灾系统呢?这就需要根据企业自身状况来定了。同样是容灾系统,如果是防火灾,则容灾中心距离数据中心只需要几百米就可以了。如果要是水灾,则要求它们之间的距离在数公里以上。如果要是预防地震的话,则需要保持几百公里的距离。此外,不同的地域需求也有不同,例如在北京,就可以不用考虑水灾的问题,而在有的地区,地震就不用考虑。
但是在企业组建容灾系统的时候,以下几点是必须考虑的:
1、 容灾系统应具有开放性,不依赖特定硬件系统。
2、应支持广泛的传输介质,支持TCP/IP网络更佳。
3、考虑到容灾能力和对应用系统性能的影响,容灾方案不仅要支持近距的、同步的数据容灾,还必须能支持远程的、异步的数据容灾。
4、对于异步数据容灾,数据复制不仅仅要求在异地有一份数据拷贝,同时必须保证异地数
据的完整性、可用性。
5、容灾系统本身应具备各种容错考虑。
6、应支持灵活多样的容灾结构。
7、完善的容灾系统应该考虑实用的灾难恢复手段。
恢复演习不可少
无论采取何种方式复制数据,容灾的最终目的都是在于灾难发生后能够在企业可以接受的时间内快速恢复系统的正常运行。那么企业建立的系统在灾后能不能快速恢复呢?这就需要企业系统在正常运行时能够进行灾难恢复演习,只有这样才能保证容灾系统确实可行。
那么企业怎样制定灾难恢复演义计划呢?一般来说要按照一下几个步骤进行:首先,制定计划。灾难恢复演习不能以停机为代价,更不能够演习之后系统无法正常运行,造成生产量的降低和