进行dp备份的检查过程中,发现一个备份session出现报错,示例如下:
[Warning] From:BSM@gd-bak02″gd_rac_arch” Time: 2006-12-30 2:00:06
[61:2013] Some of the backup devices are occupied. Session is waiting
for all the devices to get free.
[Critical] From:BSM@gd-bak02″gd_rac_arch” Time: 2006-12-30 3:00:33
[61:2015] Timeout waiting for the devices to get free.
The session will terminate.
[Critical] From:BSM@gd-bak02″gd_rac_arch” Time: 2006-12-30 3:01:09
None of the Disk Agents completed successfully.
Session has failed.
[Normal] From:BSM@gd-bak02″gd_rac_arch” Time: 2006-12-30 3:01:09
Backup Statistics:
Session Queuing Time (hours) 1.02
—————————————-
Completed Disk Agents …….. 0
Failed Disk Agents ……….. 0
Aborted Disk Agents ………. 0
—————————————-
Disk Agents Total ……….. 0
========================================
Completed Media Agents ……. 0
Failed Media Agents ………. 0
Aborted Media Agents ……… 0
—————————————-
Media Agents Total ………. 0
========================================
Mbytes Total …………….. 0 MB
Used Media Total …………. 0
Disk Agent Errors Total …… 0
报错的内容不多,但是从report中可以看到从2006-12-30 2:00:06开始该session就在等待,一直到2006-12-30 3:01:09 发生time out。
核查其具体原因,发现这个session是做数据库的archive备份,从每天凌晨2点开始,每隔4小时做一次备份,做备份时用2个driver进行备份。而恰恰在昨天,也正好是数据库全备的时间(每周二,五的凌晨0:30开始备份),数据库全备用4个driver进行。
于是发生了刚刚的报错情况:2006年12月30日0:30分开始数据库全备,用MSL6000带库的所有driver(4个driver)进行数据库全备,通过检查其全备日志发现是耗时3个小时,在3:30分的时候结束,而arch日志在2点进行备份时候,没有driver可用,因此一直等待,直到1小时后time out。
解决方法:
由于archive备份一般需要10分钟完成,数据库全备需要3小时可以完成。为保证数据库全备的速度,仍保持其使用4个driver,且保持其原来是起始时间不便(0:30开始)。修改archive日志备份的策略,改每天的4点开始,每隔4小时备份一次,最后一次的备份时间为23:30。
注意,假如report内容较多,搜索Critical会发现比较重要的告警信息。