本人前段时间刚刚做过sun上的oracle cluster项目,本人在项目实施前碰到许多问题,得益于很多网络的朋友的帮助.今日得以顺利完成,希望能以此文对大家类似问题有所帮助.
1.硬件环境
服务器的硬件环境主要包括:sun enterprise 4500主机两台,sun enterprise 450主机两台,sun A5200磁盘柜一台。
硬件主要配置
E4500:四CPU,2G内存,18.2G硬盘x2,Gigabit网卡x 2,磁带机
A5200磁盘柜:36.4G硬盘x 7
2.软件环境
服务器的系统软件为:Solaris 8,Legato Cluster 4.7,Veritas Volumes Manager 3.1。
服务器的应用软件为:ORACLE 8.1.7。
3. 应用服务器架构
两台E4500服务器本机均安装两块18.2G硬盘,通过Veritas Volumes Manager实现镜像,操作系统和数据库系统软件均安装在本机的硬盘上。
两台E4500服务器通过FC-AL HUB连接SUN A5200磁盘柜,A5200安装7(36.4Gx7)块硬盘,使用Veritas Volumes Manager软件实现RAID 5,保护磁盘柜硬盘数据。所有应用数据存放于共享磁盘柜。
两台机器使用Legato Cluster Enterprise软件,组成一个群集,数据库应用(TS/TM)同时分别在两台服务器上运行,即一台机器运行1oracle实例,另一机器运行2 oracle实例。当其中任一台服务器故障,另一台服务器能正常接管故障服务器的应用(网络和数据库),继续提供服务,即一台机器上运行oracle的3个实例。该集群中每台机器安装两块Gigabit网卡和一FastEthernet网卡,FastEthernet网卡提供心跳信息,用于检测、判断对方的状况是否正常;双Gigabit网卡相互备份,用于提供高速的客户网络服务。
4.主机名、服务名/ip地址对应表
表1:
机器名 IP Address(24位掩码) 描述
TS 192.168.7. 11 本机网卡IP
TM 192.168.7. 12
说明:表1为实际的机器名与ip地址,提供给本机器的操作系统和网卡使用;
表2:
服务名 IP Address(24位掩码) 描述
Oracle_TS 192.168.7. 1 提供OracleTS应用
Oracle_TM 192.168.7. 2 提供OracleTM应用
说明:表2为服务所对应的ip地址,提供给客户端应用服务使用。该ip地址在集群中为一浮动ip,始终与应用服务捆绑,客户端使用该ip地址就能访问到所需的服务。
5 Cluster软件使用
数据库服务器
两台E4500通过Legato Cluster组成一个集群,提供磁盘和网络服务的互备。数据库应用TS/TM同时分别在两台E4500服务器上运行。当其中任一台服务器故障(包括数据库本身异常),另一台服务器检测到后,能将故障机器的磁盘柜重新Mount上,并用不同的SID启动Oracle实例,同时捆绑上原来的服务IP地址,客户端短暂中断后,仍可重新访问到原来的数据库服务。
Cluster软件已设成当操作系统启动时,会自动启动该Cluster软件。并由Cluster软件做如下操作:
Mount上磁盘柜硬盘,
启动Oracle数据库RDBMS,以不同SID来启动各自的数据库实例,
捆绑该些服务对应的IP地址。
可通过如下Unix命令检查进程、磁盘和网络:
ps -ef |grep FT 检查Cluste Agent是否启动
可看到FTagent进程
mount 查看磁盘柜是否Mount上
ps -ef |grep ora 检查oracle数据库进程是否运行正常。
ifconfig ?a 检查网络状况,可看到ge0:1或ge0:2及所对应的服务ip,即192.168.7.1、192.168.7.2等字样