农行各省分行自2000年开始正式启动新一代综合业务系统后,在信息数据存储方面,逐步将各省数据和业务采用SAN构架进行集中处理与存放,以取代原有各个子业务系统分散存储和处理的方式。新业务模式加强了分行账务监管和数据分享,并降低了分行计算中心的运营成本。然而,随着省级大集中处理方式的建立和采用单一高端磁盘存储设备作为SAN基础构架的核心设备,业务运行系统稳定性的要求越来越高。一旦分行计算中心存储设备发生故障,将影响全省范围的分支机构与网点的所有业务,这将对银行造成巨大的经济和声誉损失,甚至导致客户流失。
2004年以前,部分省分行原有的存储设备产品设计不够稳定,并出现硬件故障,导致核心业务系统宕机的现象时有发生。另一方面,由于旧的存储系统中还存在着部分小型存储设备,这些设备已经跟不上省分行业务I/O交易量的日益增长,并曾经发生过在业务交易高峰期时导致系统宕机。同时,部分旧有存储设备还出现过因微码升级问题而引起SAN结构中的新旧设备互不匹配,从而导致系统宕机。因此,农行各省分行急需一套高可靠性和高性能的容灾备份方案,以确保省级客户数据的安全性和分行业务的整体可用性。
根据农行信息化建设的整体部署,近两年来,农行将建立全国大数据中心,实现全国业务的集中化处理。考虑到这一发展趋势以及省级IT架构的变化趋势,各省分行应采用有的放矢的原则建立省分行同机房存储设备的数据容灾备份方式,而无需投巨资建立业务连续性的容灾系统,即可确保省级客户数据的安全性,提高分行业务系统的整体可用性。
经过由农行领导和技术专家团对银行的需求分析和综合评估,中国农业银行最终为其各省分行选择了双机同机房容灾备份设计:各省分行生产中心需要配置两套中高端磁盘存储设备以及相关数据复制治理软件,分为主、备两套存储设备,并通过光纤直接与服务器群相连或通过存储交换机连接,实现系统无限制连接与存储层面的数据容灾复制;通过编写校本程序实现当主存储设备或其他相关的连接设备发生故障、并导致业务应用无法正常访问主存储设备存放的数据时,可自动切换到备份存储设备进行访问数据,从而保证业务的连续运行。同时,磁盘存储设备内部结构采用的是CPU结构,具有处理速度高、存取速度快和可扩展性强等功能。这种结构与方式对应用业务的服务器性能基本上无影响,对整个业务系统完全实现了冗余和备份。
农行各省分行自2004年开始部署双机同机房容灾备份设计方案,采用一系列高端存储磁盘产品,利用其先进、可用的数据复制与治理功能和远程数据同异步复制功能,为各省分行顺利建成双机同机房容灾备份系统。该系统的建成为农行各省分行的业务运行提供了安全可靠与高可用的系统环境,进一步保障数据和应用的可靠性,并为今后的系统扩展规划提供了方便的基础平台。