前言
企业的数据就是一个企业的生命,为了保证本地数据的安全性和可用性,传统上可以采用数据备份和主机集群的结构。现在,随着企业对数据可用性的熟悉的加深,要害业务不答应哪怕只有1%的可能性的问题对数据可用性带来的威胁,因而,异地容灾已经成为数据可用性解决方案的重要组成部分。异地容灾系统提供一个远程的应用备份现场,能有效地防止因本地毁灭性灾难(地震、火灾、水灾等)引起的数据丢失,预防场地问题带来的数据不可用性,这些场地问题包括:电力中断、电信中断、自然灾难和场地迁移等。作为企业的要害业务,任何原因造成的业务中断都将影响其经济收入,降低市场分额,丢失客户,甚至造成企业破产。容灾系统将这种"场地"故障造成的数据不可用性减到最小。当灾难发生时,容灾系统能保证企业数据的安全和业务的连续性,具体表现在:(1)数据在远程场地存有一致、可用的拷贝;(2)应用立即在远程现场运行。因此,容灾方案的核心是两个要害技术:数据容灾(即数据复制)和应用的远程切换(即发生灾难时,应用可以很快在异地切换)。
作为国内领先的计算机及信息系统公司,联想集团一直致力于对数据备份系统,主机集群系统和异地容灾系统的研究,希望提供的产品和服务能满足客户的业务和治理需求,促进双方共同发展。把自己的成功建立在客户成功的基础之上,为客户服务是联想的首要宗旨。
用户背景与项目分析
联想集团是国内最大的IT企业,经过20年的发展,目前在国内除北京平台外,在香港、上海、深圳、惠阳、沈阳、武汉、西安、成都设有区域平台,在哈尔滨、济南、南京、杭州、广州、郑州、重庆、昆明、乌鲁木齐、长春、兰州、南昌和南宁设有办事处。在国外设有欧洲区、美洲区,包括美国、英国、荷兰、法国、德国、西班牙、奥地利七间子公司。
联想在北京、上海和广东惠阳各建有一个现代化的生产基地,生产台式电脑、服务器、笔记本电脑、打印机、掌上电脑、主机板等产品,年生产能力达到500万台(电脑);同时在厦门设有大规模的手机生产基地。
在20年的发展历程中,联想已经建立起了一整套完善的企业信息化系统。从基础网络架构到办公自动化,从企业核心治理应用系统(ERP)到电子商务增值应用(CRM,SCM,PLM),联想将自己的过去、现在和未来都融入了信息化的空间。随着业务规模的不断扩大,企业的数据也在飞速地增长,联想越来越熟悉到数据对于企业的意义。2003年,联想开始着手构建自己的企业级容灾备份系统,藉此实现企业核心数据的集中治理,集中备份和远程容灾。
项目建设目标
联想集团的异地容灾系统建设预计在未来很短的时间内顺序建成北京主数据中心和位于深圳的备份数据中心,服务业务范围ERP、CRM、SCM、PDM和电子商务等应用。该系统正式运行后,将对北京主数据中心的异构平台数据,全部实现在线、快速、有效的数据备份,同时还通过裸机恢复和磁带容灾技术,将整个IT系统的备份建立在了深圳备份中心,从而保证企业信息系统的快速恢复和容灾能力,提供更高的高可用性。
应用系统分析
在联想集团异地容灾系统本期建设中,主要涉及了备份服务器、备份客户端、备份代理、裸机恢复、磁带容灾等。
Master Server:备份服务器,安装在北京,是备份系统的核心,可以实现对磁带库的配置治理,备份环境的核心数据应用库、备份策略和设备配置均存放在这台服务器上。
Media Server:安装在深圳,可以直接连接并执行自动化治理磁带库及其介质,主要作用是利用北京备份服务器产生的复制磁带和通过网络得到的复制备份信息来恢复深圳的数据。该服务器通过北京的Netbackup Master Server进行控制。
Netbackup Client:北京的ERP系统/电子商务系统/SCM系统/CRM系统/PDM系统安装备份的客户端程序,实现LAN中数据备份和恢复的基本功能。深圳的ERP系统/CRM系统直接连接到SAN中,安装Media Server实现LANFREE的备份,电子商务系统/SCM系统安装备份的客户端程序,实现LAN中的数据备份和恢复的基本功能。PDM系统按照要求只实现北京的备份数据异地保存功能,不需要在深圳设立服务器进行恢复,因此不配置客户端程序。
SAP Agent/ SQL Server Agent /Oracle Agent:北京和深圳的ERP系统/电子商务系统/SCM系统/CRM系统/PDM系统分别安装在线备份模块SAP Agent/ SQL Server Agent /Oracle Agent,实现对SAP,Oracle和SQL Server的在线全、增量备份和恢复。
BMR:北京和深圳的ERP系统/电子商务系统/SCM系统/CRM系统/PDM系统增加BMR模块,实现对北京的系统中AIX和Windows操作系统的快速灾难恢复。
Vault:对要害数据磁带实施双重备份,并运送到远程进行保存,以建立一个初级的容灾系统,实现容灾系统中最基本的磁带级数据容灾功能。首先,通过VAULT在北京每周对ERP和CRM系统的做全备份磁带,再通过交通工具将磁带运输到异地,然后,北京的备份服务器通过网络发出恢复指令,由深圳的介质服务器做异机恢复。北京和深圳之间的网络只用来传送治理信息,因此8Mb/s带宽足够。同时,当北京的服务器出现问题后,直接进行ip的接管就可以访问深圳的资源,实现了容灾功能。北京和深圳需要配置兼容同一格式磁带的磁带驱动器。每个磁带库至少两个驱动器。
其他数据备份(除ERP和CRM的全备份)通过设置多份存储单元实现两地备份,进而实现异机恢复,即能够将某北京Client数据备份恢复到深圳的Client。
Netbackup采用多路写复用(Multi-plex)、多路数据流分用(Multi-Stream)等技术完成对备份数据流的优化统筹分配,最终完全利用备份硬件设备提供的所有I/O带宽。
由于备份系统核心数据库CATALOG会备份到北京中心机房和深圳远程磁带库上,因此备份系统具有灾难恢复的能力,即在主机房或备份服务器完全瘫痪的情况下,可以在北京和深圳的任何服务器上安装操作系统和Netbackup Server,然后恢复CATALOG,就可以找回备份磁带内容,进而利用数据磁带恢复所有系统。
QQRead.com 推出数据恢复指南教程 数据恢复指南教程
数据恢复故障解析
常用数据恢复方案
硬盘数据恢复教程
数据保护方法
数据恢复软件
专业数据恢复服务指南
网络结构及拓扑图
联想集团的异地容灾系统是一个两地四级的备份和容灾系统:包括备份客户端,介质服务器,备份主服务器和磁带库。北京和深圳两地的备份局域网将采用1000M以太网,两地之间通过8M专线连接。各级之间的分布情况如下:
备份客户端:包括北京的ERP系统/电子商务系统/SCM系统/CRM系统/PDM系统上安装的备份客户端程序,实现LAN中数据备份和恢复的基本功能。另外包括深圳的电子商务系统/SCM系统上安装的备份客户端程序。
介质服务器:深圳的ERP系统/CRM系统直接连接到SAN中,并安装Media Server(介质服务器),实现LANFREE的备份。
备份主服务器:安装在北京,是备份系统的核心,可以实现对磁带库的配置治理,备份环境的核心数据应用库、备份策略和设备配置均存放在这台服务器上。
磁带库:电子商务、SCM系统、PDM系统通过网络进行系统全备份,其它两套系统ERP、CRM系统全备份通过VERITAS Netbackup Vault功能将磁带通过交通工具每周运送到深圳,而其天天的增量备份可以通过网络完成。磁带运送到深圳后,通过指令备份系统进行重新导入磁带信息,然后再通过磁带恢复系统。北京和深圳需要配置兼容同一格式磁带的磁带驱动器。北京需要一个磁带库,其中至少两个驱动器。
全部的备份系统网络结构如下图所示(点击放大):
点击查看大图
QQRead.com 推出数据恢复指南教程 数据恢复指南教程
数据恢复故障解析
常用数据恢复方案
硬盘数据恢复教程
数据保护方法
数据恢复软件
专业数据恢复服务指南
方案和硬件选型
联想根据对集团信息系统备份容灾需求的分析,充分考虑了在当前的业务需求和将来的业务发展,为该项目提供了系统的解决方案和相关技术产品。
具体配置如下:
各级备份容灾系统的要害任务是实现对企业数据的在线、快速、有效的数据备份,同时还要实现在深圳备份中心的快速恢复和容灾能力。这一切首先要求服务器和存储具有极高可靠性、丰富的治理性能、强大的数据处理能力及扩展性、适用于多种网络操作系统等特性。所以,联想推荐使用了万全R630服务器作为业务应用服务器、R520服务器作为备份服务器,以及Sure Fibre920磁盘阵列作为数据集中存放设备。
整个方案的优势在于:
高可靠性(通过Duplicate功能实现):数据备份是为了防止在用数据被破坏或出错后可以从磁带上恢复,因此磁带上的数据一定是可靠的,为了避免磁带故障而导致的数据不可靠性,数据备份系统应该能够同时将一个数据存放到多个磁带上。
容灾能力(通过Vault实现):数据的两个拷贝存放在同一个地方也存在着隐患,保持一定的距离可以预防意外灾难。美国911事件中许多世贸大楼里的公司正是将其数据的磁带拷贝存放到远程才得以在灾难后恢复数据的。由此可见,远程磁带治理是存储备份/恢复软件必不可少的功能。也许项目实施时你不想采用它,但当你想使用时就立即可以用,不需要更换现有软件,保护现有投资。
高性能(LAN Free):数据备份是需要占用数据库服务器的系统资源的,会引起应用的性能下降。因此,数据备份经常在系统相对空闲的时候进行。但是,今天的许多应用环境面临着两大问题,其一,数据量太大,在预定的时间段内完不成备份;其二,7x24x365繁忙,几乎不答应备份窗口。虽然今天工行的业务系统还可以有足够的备份窗口,但随着工行业务的迅速扩大,将来肯定会碰到备份系统的性能问题。因此所选择的数据备份/恢复解决方案必须具有相应的技术,解决客户随时出现的需求。
快速系统恢复(BMR):数据备份的最终目的是数据恢复,对数据恢复的要求肯定是快速、准确、无误。在以往的经验中,我们往往强调了数据的恢复,而忽略了整个系统的恢复。试想一下,假如整个数据库应用系统(包括操作系统)都被破坏需要恢复时,我们经常做什么呢?装系统,装卷治理器,装备份软件等等,复杂而漫长的过程,严重影响了系统的高可用性。数据备份/恢复软件必须具备“一键”恢复系统的功能,减少数据恢复的复杂度和时间。
方案实施对在用系统的影响尽可能小(Consulting Service):解决方案供给商必须有丰富的实施经验,能够快速、准确地实施所推荐的方案。经验告诉我们,产品虽好,假如没有强大的工程实施能力及技术支持能力,客户也不能从中受益,甚至陷入困境。因此,对公司的选择有时比对产品的选择更重要。
可扩展性:可扩展性不仅包括容量的扩展,还包括功能的扩展。例如客户今天的应用数据量不大,不需要数据迁移,但是两年后很可能需要这个功能。假如客户今天选择的方案根本不支持这个功能,难道两年后再更换备份系统?再如,今天采用LAN Free就可以满足备份性能要求,但是两年后可能需要Server Less。因此解决方案一定要具备这种特性,即使今天客户还不用。方案中选择的VERITAS软件是业界率先实现Server Less的厂商,其Server Less至今为止是支持硬件种类最多的解决方案。
服务器的具体配置如下:
联想万全R630服务器推荐配置(ERP/SCM/CRM/PDM/电子商务业务应用服务器)
处理器:四颗Intel XEON 1.4~1.6GHz处理器
内 存:配置4-8G ECC DDR内存
硬 盘:配置5块36G SCSI热插拔硬盘
RAID卡:Ultra 160 SCSI 双通道RAID卡
联想万全R520服务器建议配置(备份服务器,介质服务器)
处理器:两颗Intel XEON 2.4GHz CPU;
内存:内存配置2G ECC DDR内存;
硬盘:各配3个36G SCSI 热插拔硬盘;
RAID卡:双通道Ultra 160 SCSI RAID卡;
联想Sure Fibre920磁盘阵列建议配置(数据集中存放)
920R:1个;
920J:2个;
硬盘:2*14*73G热插拔光纤通道硬盘;
存储分区软件:8 Partition;
存储治理软件:治理软件Windows2000版本。
QQRead.com 推出数据恢复指南教程 数据恢复指南教程
数据恢复故障解析
常用数据恢复方案
硬盘数据恢复教程
数据保护方法
数据恢复软件
专业数据恢复服务指南
客户投资收益
联想集团的异地容灾备份系统建设采用业界最先进的备份技术完成了对目前系统既有AIX,又有Window的环境的系统实现数据在线、快速、有效的磁带备份保护。同时通过裸机恢复和磁带容灾技术,从技术上保证了系统的快速恢复和容灾能力,从而提高了整个信息系统的高可用性。它的建设实现了联想集团企业核心数据的集中治理,集中备份和远程容灾;促进了企业IT治理部门技术观念的转变和对新技术把握能力的提高;它的建设为联想的企业IT建设书写了新的篇章,必将为联想集团新的飞速发展做出突出的贡献。