概述
在真正的海量数据库环境中,
DBA可能会花费很多的时间来作磁盘治理,比如一个表空间将占满整个磁盘,DBA就需要再添加一块磁盘到操作系统中,然后再在新的磁盘上创建新的数据文件,假如是单个磁盘这倒不是很繁琐,问题是假如原先我们使用的是RAID或者说是LVM,那么现在大量的数据仍然是分布在以前的那些磁盘上,假如我们想让这些数据均匀地分布在以前的磁盘和新增加的磁盘上,我们可能就要耗费一天甚至几天的时间来作原先数据的导出导入。那么假如有一种方法,能实现我们就把一块磁盘加到系统里,然后告诉Oracle我们要用这块盘了,剩下的工作全部由Oracle来完成,该是多好的一件事情!幸运的是,Oracle10g已经提供了这个功能,这就是ASM(Automatic Storage Management)。我们称为“自动存储治理”。Oracle10g的ASM不但帮助DBA从繁琐的磁盘空间治理中解脱出来,而且更值得关注的是ASM同时提供了条带和镜像的功能,而这些功能原先需要通过单独地配置RAID来实现。
本文通过vmware安装RHEL3 + Oracle10g,来体验ASM数据库的强大功能,为什么要使用vmware?因为在vmware中我们可以随意地添加或者删除虚拟磁盘(Virtual Disk),这样可以更方便地测试ASM数据库,我想不是谁都可以顺手抓出五六块硬盘来作这样的测试的J
硬件配置
IBM R50 5GC
迅驰1.5G,1G内存,40G硬盘
软件配置
WindowsXP PRo SP1,VMware GSX Server 2.5.1,RHEL3,Oracle10g for linux
安装VMware
这一步就不多说了,我安装的是VMware GSX Server,没有测试过VMware Workstation,所以不保证可以实现本文中的步骤。
在VMware中安装RHEL3
<!--[if !supportLists]-->1. <!--[endif]-->安装RHEL3
这个过程也不多说了,跟实际环境中安装RHEL3一样。值得注重的是,由于通过Vmware所以可能在安装时无法正常启动Xwindow,那么在字符界面下安装就可以了。安装完毕重新启动系统,Xwindow会自动启动的。记住安装所有的开发包即可,这将会尽量避免以后可能出现的link错误。我的测试环境中给了RHEL3总共384M的内存。
<!--[if !supportLists]-->2. <!--[endif]-->添加4块虚拟磁盘
按照如下操作,在虚拟机的属性中选择添加硬件,然后添加一个Virtual Disk
下一步,由于我们创建的虚拟磁盘只是用来放置Oracle的数据文件,而且我们将使用ASM中的failgroup的条带功能,所以设置最大size是1G就足够了。
下一步,指定虚拟磁盘文件的名称和存放位置,默认存放在虚拟机的相同目录下。这里我们指定文件名为physical1
点击Advanced按钮,设置虚拟磁盘的物理挂载点,通常我们选择和虚拟机已有的系统盘在不同的SCSI端口上,比如我们虚拟机的系统盘是SCSI0:0,那么就设置这个磁盘为SCSI1:0。即将添加的另外三块磁盘依次为SCSI1:1、SCSI1:2和SCSI1:3
由于Virtual Disk的特点,在新创建这个磁盘文件的时候,
并不会用到最大的size,所以即使整个分区的空闲容量没有4G(我们要创建4个最大size是1G的虚拟磁盘),也不会有问题,虚拟磁盘文件的大小是随着需要而持续增加的,最大增加到指定的max size。当然这种特性也就导致了使用Virtual Disk比使用Plain Disk(创建时即占用max size大小的磁盘空间)的I/O效率要低,所以假如有足够的磁盘空间,那么建议使用Plain Disk,创建Plain Disk的方法是在上面的第二步时,在“Allocate all disk space now”的复选框前面打勾,这样将会创建一个以pln和dat为扩展名的虚拟磁盘文件。Plain Disk的好处还在于可以模拟RAC环境中的共享磁盘,这是Virtual Disk无法作到的。模拟RAC不在本文叙述的范围内。
<!--[if !supportLists]-->3. <!--[endif]-->更新内核
>uname -a
RHEL3默认安装的linux内核版本是2.4.21-4,为了能够正确的地安装oracleasm lib,我们需要将内核升级到2.4.21-15.EL,否则将无法正常启用oracleasm。
原因是我们安装的oracleasmlib是已经编译好的rpm包,而我们当前操作系统的内核必须和编译时候的系统内核版本一样,否则即使看上去安装正常,但是在启动oracleasm时候会在/var/log/messages文件中发现类似如下的报错信息:
kernel-module version mismatch
^I/lib/modules/2.4.21-EL-ABI/oracleasm/oracleasm.o was compiled for kernel version 2.4.21-15.EL ^Iwhile this kernel is version 2.4.21-4.EL.
从这个报错信息中我们也可以知道应该安装的内核版本,为了更确切地知道下载的oracleasm包需要哪个版本的内核,我们也可以先下载oracleasm,安装,启动然后查看这个报错信息,之后再升级内核到相应的版本。
注重:本文中提到的2.4.21-15.EL内核是本文编写时oracleasm编译使用的内核,随着oracle不断地推出asmlib的新版本,需要的内核版本可能也在不断变化。
下载新内核:
kernel-2.4.21-15.EL.i686: http://public.planetmirror.com/pub/pmstuff/patches/kernel-2.4.21-15.EL.i686.rpm
安装新内核:
# rpm –ivh –-nodeps kernel-2.4.21-15.EL.i686.rpm
安装完毕以后,修改/boot/grub/grub.conf,rpm安装完毕以后,应该已经自动在grub.conf文件中添加了新版kernel启动的段落,我们需要将default=1修改为default=0,这样保证每次启动都用新的内核启动,当测试没有问题之后,我们也可以直接删除grub.conf文件中的title Red Hat Enterprise Linux AS (2.4.21-4.EL)部分,防止因错误操作而使用了原有的系统内核启动系统。
# cat /boot/grub/grub.conf
# grub.conf generated by anaconda
#
# Note that you do not have to rerun grub after making changes to this file
# NOTICE: You do not have a /boot partition. This means that
# all kernel and initrd paths are relative to /, eg.
# root (hd0,0)
# kernel /boot/vmlinuz-version ro root=/dev/sda1
# initrd /boot/initrd-version.img
#boot=/dev/sda
default=0
timeout=10
splashimage=(hd0,0)/boot/grub/splash.xpm.gz
title Red Hat Enterprise Linux AS (2.4.21-15.EL)
root (hd0,0)
kernel /boot/vmlinuz-2.4.21-15.EL ro root=LABEL=/
initrd /boot/initrd-2.4.21-15.EL.img
title Red Hat Enterprise Linux AS (2.4.21-4.EL)
root (hd0,0)
kernel /boot/vmlinuz-2.4.21-4.EL ro root=LABEL=/
initrd /boot/initrd-2.4.21-4.EL.img
修改完毕以后,重新启动系统,保证使用了新内核
# uname –a
Linux LinuxNode1 2.4.21-15.EL #1 Thu Apr 22 00:27:41 EDT 2004 i686 i686 i386 GNU/Linux
安装Oracle ASMLib
下载ASMLib需要的三个文件:
asmlib:http://otn.oracle.com/software/tech/linux/asmlib/files/RPMS/rhel3/x86/oracleasmlib-1.0.0-1.i386.rpm
asm-support:http://otn.oracle.com/software/tech/linux/asmlib/files/RPMS/rhel3/x86/oracleasm-support-1.0.2-1.i386.rpm
asm-kernel:http://otn.oracle.com/software/tech/linux/asmlib/files/RPMS/rhel3/x86/oracleasm-2.4.21-EL-1.0.0-1.i686.rpm
假如是多处理器的版本,那么可以下载下面这个文件替换上面的第三个文件:
asm-smp-kernel:http://otn.oracle.com/software/tech/linux/asmlib/files/RPMS/rhel3/x86/oracleasm-2.4.21-EL-smp-1.0.0-1.i686.rpm
安装:
$su –
# rpm -Uvh oracleasm-support-1.0.2-1.i386.rpm \
oracleasm-lib-1.0.0-1.i386.rpm \
oracleasm-2.4.21-EL-1.0.0-1.i686.rpm
配置ASMLib:
# /etc/init.d/oracleasm configure
Configuring the Oracle ASM library driver.
This will configure the on-boot properties of the Oracle ASM library
driver. The following questions will determine whether the driver is
loaded on boot and what permissions it will have. The current values
will be shown in brackets ('[]'). Hitting without typing an
answer will keep that current value. Ctrl-C will abort.
Default user to own the driver interface []: oracle
Default group to own the driver interface []: dba
Start Oracle ASM library driver on boot (y/n) [n]: y
Fix permissions of Oracle ASM disks on boot (y/n) [y]: y
Writing Oracle ASM library driver configuration [ OK ]
Creating /dev/oracleasm mount point [ OK ]
Loading module "oracleasm" [ OK ]
Mounting ASMlib driver filesystem [ OK ]
Scanning system for ASM disks [ OK ]
以上操作将加载oracleasm.o驱动,并且mount上ASM文件系统,同时我们可以通过以下命令来手工的卸载和加载ASMLib
# /etc/init.d/oracleasm disable
Writing Oracle ASM library driver configuration [ OK ]
Unmounting ASMlib driver filesystem [ OK ]
Unloading module "oracleasm" [ OK ]
# /etc/init.d/oracleasm enable
Writing Oracle ASM library driver configuration [ OK ]
Loading module "oracleasm" [ OK ]
Mounting ASMlib driver filesystem [ OK ]
Scanning system for ASM disks [ OK ]
假如当前操作系统的内核和编译ASMLib的内核不同,那么上面的操作将会出错,请检查/var/log/messages文件,确认需要更新的系统内核版本。
添加init文件使系统启动时自动加载ASMLib
$ su –
# cd /etc/rc3.d
# ln -s ../init.d/oracleasm S99oracleasm
# ln -s ../init.d/oracleasm K01oracleasm
注重:假如系统启动是自动进入图形界面,也就是系统的init level是5,那么上面生成链接的命令应该在/etc/rc5.d目录中操作。
重新启动系统,确认ASMLib已经可以自动加载
#lsmod grep oracleasm
oracleasm 14224 1
#dmesg grep oracleasm
ASM: oracleasmfs mounted with options:
创建ASM磁盘
# /etc/init.d/oracleasm createdisk VOL1 /dev/sdb
Marking disk "/dev/sdb" as an ASM disk [ OK ]
# /etc/init.d/oracleasm createdisk VOL2 /dev/sdc
Marking disk "/dev/sdc" as an ASM disk [ OK ]
# /etc/init.d/oracleasm createdisk VOL3 /dev/sdd
Marking disk "/dev/sdd" as an ASM disk [ OK ]
#/etc/init.d/oracleasm createdisk VOL4 /dev/sde
Marking disk "/dev/sde" as an ASM disk [ OK ]
# /etc/init.d/oracleasm listdisks
VOL1
VOL2
VOL3
VOL4
假如要删除ASM磁盘通过以下命令:
# /etc/init.d/oracleasm deletedisk VOL4
Removing ASM disk "VOL4" [ OK ]
注重:假如是在RAC环境中的某一个节点中添加了ASM磁盘,那么需要在其它的节点上运行scandisk来获取这种变化。
# /etc/init.d/oracleasm scandisks
Scanning system for ASM disks [ OK ]
具体的安装文档可以通过以下连接查看:
http://otn.oracle.com/tech/linux/asmlib/install.Html
现在我们已经完成了创建ASM实例的物理基础,下面开始安装数据库。
安装Oracle10g
在RHEL3上安装Oracle10g已经是非常简单的操作了,只要系统内核参数设置正确,几乎不会碰到任何问题。
从以下连接可以得到在RHEL3上安装Oracle10g的具体步骤,本文不再赘述。
http://www.puschitz.com/InstallingOracle10g.shtml
在安装Oracle10g的时候,我们选择不创建数据库,只安装软件的方式,在软件安装结束以后再通过dbca来创建ASM实例和数据库。
创建ASM实例
<!--[if !supportLists]-->1. <!--[endif]-->创建初始化文件
$ su – oracle
$ cd $ORACLE_HOME/dbs
$ vi init+ASM.ora
创建asm实例的初始化脚本,脚本内容如下所示:
# ******Below is init script for asm instance******
*.asm_diskstring='ORCL:VOL*'
*.background_dump_dest='/oracle/admin/+ASM/bdump'
*.core_dump_dest='/oracle/admin/+ASM/cdump'
*.instance_type='asm'
*.large_pool_size=12M
*.remote_login_passWordfile='SHARED'
*.user_dump_dest='/oracle/admin/+ASM/udump'
# ******Above is init script for asm instance******
说明:
<!--[if !supportLists]-->1. <!--[endif]-->dump目录指向$ORACLE_BASE/,本文中ASM实例的SID是+ASM。最好不要修改这个实例名,否则在下一步用dbca创建数据库的时候,dbca将找不到可用的磁盘组,我想这应该是dbca的一个bug,手工创建ASM类型的数据库就应该没有这个限制了。
<!--[if !supportLists]-->2. <!--[endif]-->asm_diskstring用于实例启动的时候检查可用的ASM磁盘,由于我们前面创建ASM磁盘的名称是VOL1到VOL4,所以我们此处使用*通配符,前面的’ORCL:’不可以省略,否则ASM实例将无法检查到磁盘。
<!--[if !supportLists]-->2. <!--[endif]-->创建密码文件
$ su – oracle
$ cd $ORACLE_HOME/dbs
$ orapwd file=orapw+ASM password=dba
<!--[if !supportLists]-->3. <!--[endif]-->创建目录结构
$ su – oracle
$ cd $ORACLE_HOME/dbs
$ mkdir –p $ORALCE_BASE/admin/+ASM/udump
$ mkdir –p $ORALCE_BASE/admin/+ASM/bdump
$ mkdir –p $ORALCE_BASE/admin/+ASM/cdump
<!--[if !supportLists]-->4. <!--[endif]-->启动实例
$ export ORACLE_SID=+ASM
$ sqlplus / as sysdba
SQL> startup
ASM instance started
Total System Global Area 100663296 bytes
Fixed Size 777616 bytes
Variable Size 99885680 bytes
Database Buffers 0 bytes
Redo Buffers 0 bytes
ORA-15110: no diskgroups mounted
因为我们是首次启动asm实例,还没有创建diskgroup,所以显示15110错误是正常的。
假如启动实例的时候碰到如下报错:
ORA-29701: unable to connect to Cluster Manager
那么请检查/etc/inittab文件,看看是否有下面这行
h1:35:respawn:/etc/init.d/init.CSSd run >/dev/null 2>&1
假如没有请添加,假如被注释了请取消注释。
<!--[if !supportLists]-->5. <!--[endif]-->创建spfile,重新启动
SQL> create spfile from pfile;
SQL> shutdown immediate;
SQL> startup;
<!--[if !supportLists]-->6. <!--[endif]-->创建diskgroup
SQL> create diskgroup dgroup1 normal redundancy
2 failgroup fgroup1 disk 'ORCL:VOL1','ORCL:VOL2'
3 failgroup fgroup2 disk 'ORCL:VOL3','ORCL:VOL4';
Diskgroup created.
SQL> col name for a10
SQL> select name,state from v$asm_diskgroup;
NAME STATE
---------- ----------------------
DGROUP1 MOUNTED
假如上述命令返回的state是DISMOUNTED,那么我们需要手工将挂载diskgroup
SQL> ALTER DISKGROUP dgroup1 MOUNT;
Diskgroup altered.
此时检查数据库初始化参数,发现asm_diskgroups参数值已经自动设置为DGROUP1,这表明在下次启动asm实例的时候,这个diskgroup会被自动挂载。
SQL> col name for a10
SQL> col type for a10
SQL> col value for a20
SQL> show parameter asm_diskgroups
NAME TYPE VALUE
------------------------------------ ---------- ------------------------------
asm_diskgroups string DGROUP1
假如要卸载diskgroup,使用下面的命令:
ALTER DISKGROUP ALL DISMOUNT;
创建ASM数据库
用dbca创建数据库,一直到选择数据类型的画面以前都跟创建普通数据库没有区别。
下面是dbca创建数据库的第6步画面,普通的数据库我们通常选择File System,而ASM类型的数据库我们则要选择“Automatic Storage Management”。
下一步,oracle将自动检查出已经加载的Diskgroup,在这个界面我们可以通过Create New按钮创建新的Diskgroup,也可以通过Add Disks按钮向当前的磁盘组中添加额外的磁盘,当然这些磁盘必须是先用oracleasm createdisk过的(在第4章节的创建ASM磁盘部分有所叙述)。
在数据文件的位置治理设定界面,通常应该使用OMF,由oracle自己治理数据文件的命名,这样才算是进一步解放了DBA对于物理存储方面的繁琐工作。
继续往下的步骤,跟创建普通数据库已经没有什么区别了。不再赘述。
启动ASM数据库的步骤
由于启动ASM数据库必须要先启动ASM实例,所以基本上启动步骤如下。
<!--[if !supportLists]-->1. <!--[endif]-->以oracle用户进入操作系统
<!--[if !supportLists]-->2. <!--[endif]-->$ export ORACLE_SID=+ASM
<!--[if !supportLists]-->3. <!--[endif]-->SQL> sqlplus / as sysdba
<!--[if !supportLists]-->4. <!--[endif]-->SQL> startup
<!--[if !supportLists]-->5. <!--[endif]-->SQL> exit
<!--[if !supportLists]-->6. <!--[endif]-->$ export ORACLE_SID=
<!--[if !supportLists]-->7. <!--[endif]-->SQL> sqlplus / as sysdba
<!--[if !supportLists]-->8. <!--[endif]-->SQL> startup
ASM数据库的简单测试
测试ASM数据库的automatic rebalance功能
添加两个虚拟硬盘,分别是sdf和sdg,大小500M
启动系统,启动ASM实例,启动数据库实例
创建ASM磁盘
#/etc/init.d/oracleasm createdisk VOL5 /dev/sdf
#/etc/init.d/oracleasm createdisk VOL6 /dev/sdg
登入ASM实例检查v$asm_disk视图,发现这两个新加的硬盘已经找到了
将硬盘添加到磁盘组中
SQL> ALTER DISKGROUP DGROUP1 ADD FAILGROUP FGROUP1 DISK 'ORCL:VOL5' FAILGROUP FGROUP2 DISK 'ORCL:VOL6';
Diskgroup altered.
检查数据库的auto rebalance工作进度,数据库正在将原来分布在两个磁盘上的数据平均分配到三个磁盘上
SQL> SELECT group_number, Operation, state, est_work, sofar, est_rate, est_minutes FROM v$asm_operation;
GROUP_NUMBER OPERATION STATE EST_WORK SOFAR EST_RATE EST_MINUTES
------------ ---------- -------- ---------- ---------- ---------- -----------
1 REBAL RUN 416 0 0 0
SQL> /
GROUP_NUMBER OPERATION STATE EST_WORK SOFAR EST_RATE EST_MINUTES
------------ ---------- -------- ---------- ---------- ---------- -----------
1 REBAL RUN 275 39 148 1
SQL> /
以上表示数据重新分配的工作已经成功完成
SQL> select name,allocation_unit_size,total_mb from v$asm_diskgroup;
NAME ALLOCATION_UNIT_SIZE TOTAL_MB
------------------------------ -------------------- ----------
DGROUP1 1048576 5120
现在磁盘组空间总共是5120M
登入数据库实例
创建一个自己的表空间,创建一个用户,创建一个表
SQL> create tablespace ts_test datafile '+DGROUP1' size 200M;
Tablespace created.
SQL> create user kamus identified by pass default tablespace ts_test;
User created.
SQL> grant dba to kamus;
Grant sUCceeded.
SQL> conn kamus/pass
Connected.
SQL> create table t_test as select * from dba_objects;
Table created.
SQL> select count(*) from t_test;
COUNT(*)
----------
10319
登入ASM实例,将磁盘从磁盘组中删除
SQL> alter diskgroup dgroup1 drop disk VOL4;
Diskgroup altered.
SQL> SELECT group_number, operation, state, est_work, sofar, est_rate, est_minutes FROM v$asm_operation;
GROUP_NUMBER OPERATION STATE EST_WORK SOFAR EST_RATE EST_MINUTES
------------ ---------- -------- ---------- ---------- ---------- -----------
1 REBAL RUN 566 46 151 3
SQL> select name,allocation_unit_size,total_mb from v$asm_diskgroup;
NAME ALLOCATION_UNIT_SIZE TOTAL_MB
------------------------------ -------------------- ----------
DGROUP1 1048576 4096
Executed in 0.13 seconds
SQL> select label,failgroup from v$asm_disk;
LABEL FAILGROUP
------------------------------- ------------------------------
VOL1 FGROUP1
VOL2 FGROUP1
VOL3 FGROUP2
VOL5 FGROUP1
VOL6 FGROUP2
可以看到磁盘组的总容量已经减少了,磁盘数目也减少了
有些文档上说删除了磁盘之后要执行:ALTER DISKGROUP REBALANCE
但是发现不需要手动执行,整个REBALANCE的工作确实是自动的,当删除磁盘以后,数据库自动开始作REBALANCE了
为了两个FAILGROUP的大小相同,再删除一个磁盘
SQL> alter diskgroup dgroup1 drop disk VOL2;
Diskgroup altered.
我们可以从下面的SQL知道在ASM实例中可以查询到所有可以用的磁盘,而在数据库实例中只可以查询到让自己使用的磁盘
ASM实例:
SQL> SELECT disk_number, label FROM V$asm_disk;
DISK_NUMBER LABEL
----------- --------------------------------------------------------------
0 VOL4
1 VOL2
0 VOL1
2 VOL3
4 VOL5
5 VOL6
数据库实例:
SQL> SELECT disk_number, label FROM V$asm_disk;
DISK_NUMBER LABEL
----------- -------------------------------
0 VOL1
2 VOL3
4 VOL5
5 VOL6
总结
通过上面简单的测试,我们已经可以基本领略到ASM数据库在数据文件存储方面的强大功能,欢迎大家对于ASM数据库进行更深入的讨论。假如有任何问题,可以到www.itpub.net的Oracle10g和新技术板块进行讨论,也可以给我发邮件,邮件地址: kamus@itpub.net。