许多公司的关键业务都要求服务器7X24小时不间断运行,并且要保证数据万无一失。通常我们采用以下两种方式保护服务器,一是把两台服务器共享磁盘阵列柜做成集群,二是在两台服务器间安装双机容错软件。
以上两种方式各有优缺点,采用磁盘阵列方式一次性投资较高,采用双机容错软件方式具有较高的性价比和极高的可靠性,当主服务器宕机时,备份服务器能够迅速接管主服务器运行的任务和宝贵的数据,保证服务器永不停机、数据永不丢失。
目前,双机容错软件的产品也较多,下面以实际工作中所使用的CA公司SurviveIT4.5容错软件保护SQL7.0数据库数据为例,介绍双机容错软件的原理及使用方法。
软件工作原理简介
该软件的运行操作系统环境为WINNT4.0(SP4以上),网络协议为TCP/IP,为防止数据堵塞,建议每台服务器配置双网卡,在两台服务器之间建立一条专用数据备份线路。软件初始运行时,首先把primary server需要保护的数据与second server进行同步,服务器数据同步结束后,primary server便自动处于保护状态,以后每当primary server发生数据变化时,容错软件通过专用数据备份线路自动进行与second server的数据同步,保证两边数据一致,当两台服务器相互检测不到信号而失去通讯时,两台服务器便分别Ping网上事先特别指定的设备。
如果primary server能Ping通,则不切换(代表网络系统工作正常),否则自动Failover,primary server发生Failover时,机器名将自动变为原机器名加上Fail后缀,IP也将改为事先规定的IP地址;如果second server此时不能Ping通指定设备,则不发生接管,否则stand in,second server接管后,除了能保证数据和主服务器完全一致外,还能保证网络用户对服务器数据库的操作权限不变,同时文件共享权限也保持不变,整个服务器切换过程仅需半分钟左右。特别需要指出的是,与其它双机容错软件相比,该软件增加了当两台服务器失去通讯联系时,两台服务器要分别进行与网上指定设备通讯是否正常的判别,这就保证了两台服务器不会发生误动作。
容错软件的参数配置
两台服务器安装完SurviveIT后,primary server和second server便自动出现在管理软件的managed servers列表中。此时需要建立一个Replication Task:
1.选中主服务器primary server;
2.选中数据备份服务器second server;
3.选择网络速度(10M选Fast,100M选Very Fast);
4.选择数据保护等级,一般选择Full Protection(既能进行数据的实时备份,也能进行服务器的实时切换);
5.从primary server中选择需要保护的目录;
6.选择primary server中被保护目录中的文件共享;
7.选择Enable intelligent failover和Detect another computer or network device;
8.选择Transfer Primary IP address to the secondary server on failover,Change primary IP address on failover。
9.从已建立好的Replication Task中可更改数据在second server中的备份路径;
10.在Replication Task的Failover Actions中,分别对primary server和second server增加SQL7.0 scripts;
11.运行建好Replication Task后的第一次数据同步,同步结束后primary server自动处于保护状态。
主服务器的恢复
SurviveIT4.5对主服务器的数据恢复极其方便,当primary server修复后,用户只要在second server上点击一下Reinstate按钮,便自动完成主服务器的数据恢复,second server也自动处于原始备份状态,恢复所需时间由被保护的数据量大小和网络速度决定。
双机容错软件使用注意事项
1. 通常两台服务器都装成主域控制器和备份域控制器方式;
2. 数据专用线路一般采用把双绞线1-2和3-6交叉的方式连接两台服务器,运行的协议由具体容错软件确定,有的要求是TCP/IP,也有的TCP/IP或NetBEUI协议均可;
3. 在两台服务器安装容错软件时需要用不同的软件序列号;
4. 容错软件运行时必须保证使用系统管理员身份和密码;
5. 两台服务器的配置不一定要求完全一样,必须保证备份服务器的数据硬盘容量不能小于主服务器;
6. 为了保证两台服务器数据完全一致,手工删除数据时,要在主服务器端删,不要在备份服务器上删,否则易造成两边数据不同步;
7. 对于SQL数据库,进行主服务器数据恢复时,最好先手工停掉备份服务器上的SQL服务,以防恢复期间的新数据丢失;
8. 即使安装了双机容错软件,也要定期检查两台服务器的数据实时备份情况,确保数据的安全性。