ORACLE数据库恢复技术 - 王朝网络宽屏版

一、恢复的意义

当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重新建立一个完整的数据库，该处理称为数据库恢复。恢复子系统是数据库管理系统的一个重要组成部分。恢复处理随所发生的故障类型所影响的结构而变化。

二、恢复的方法

IMPORT方法：

利用IMPORT，将最后一次EXPORT出来的数据文件IMPORT到新的数据库中，这种方式可以将任何数据库对象恢复到它被导出时的状态，此后的变化将无法挽回。IMPORT的命令可以交互式进行，各参数的具体含义见ORACLE EXP/IMP参数详解。这种方式适用于没有采用archive 模式的环境。

安全的恢复方法：

如果数据库运行在archive 模式下，那么一旦数据库损坏则可以通过冷备份(热备份)和归档备份将数据库恢复到断点状态。

数据库控制文件恢复（假设所有控制文件均被破坏）：

数据库基于文件系统：利用操作系统的tar、cp等命令即可。

数据库基于裸设备：dd if=$ORACLE_BASE/con.bak of=/dev/rdrd/drd1 seek=12

数据库数据文件恢复

数据及索引表空间、系统表空间的恢复：

回拷相关的数据库文件和该数据文件备份以来所有生成的所有逻辑日志文件并执行如下命令：

svrmgrl > startup mount

svrmgrl > alter database recover automatic

如果控制文件被破坏，则：svrmgrl > alter database recover using backup controfile; 按照提示输入log文件名和redolog文件名

svrmgrl > alter database open resetlogs;

数据库临时文件和回滚表空间的恢复：简单地offline drop 并重建即可。

注意：如果数据库不运行在archive 模式下，则恢复只能恢复到上次备份时的状态。关于archive 模式的设定，以及备份的相关技术，参见ORACLE数据库备份技术

三、ORACLE表空间恢复方案

（一）、户表空间

错误现象：

在启动数据库时出现ORA-01157，ORA-01110或操作系统级错

误例如ORA-07360，在关闭数据库（使用shutdown normal或shutdown immediate）时将导致错误ORA-01116，ORA-01110以及操作系统级错误ORA-07368

解决：

以下有两种解决方案：

方案一、用户的表空间可以被轻易地重建

即最近导出的对象是可用的或表空间中的对象可以被轻易地重建等。在这种情况下，最简单的方法是offline并删除该数据文件，删除表空间并重建表空间以及所有的对象。

svrmgrl> startup mount

svrmgrl> alter database datafile filename offline drop;

svrmgrl> alter database open;

svrmgrl> drop tablespace tablespace_name including contents;

重建表空间及所有对象。

方案二、用户的表空间不能够被轻易地重建

在大多数情况下,重建表空间是不可能及太辛苦的工作.方法是倒备份及做介质恢复.如果您的系统运行在NOARCHIVELOG模式下，则只有丢失的数据，在online redo log中方可被恢复。

步骤如下：

1)Restore the lost datafile from a backup

2)svrmgrl> startup mount

3)svrmgrl> select v1.group#,member,sequence#,first_change# from v$log v1,v$logfile v2 where v1.group#=v2.group#;

4)如果数据库运行在NOARCHIVELOG模式下则：svrmgrl> select file#,change# from v$recover_file;

如果 CHANGE# 大于最小的FIRST_CHANGE#则数据文件可以被恢复。

如果 CHANGE# 小于最小的FIRST_CHANGE#则数据文件不可恢复。恢复最近一次的全备份或采用方案一。

5)svrmgrl> recover datafile filename;

6)确认恢复成功

7)svrmgrl> alter database open resetlogs;

只读表空间无需做介质恢复，只要将备份恢复即可。唯一的例外是：

表空间在最后一次备份后被改为read-write 模式

表空间在最后一次备份后被改为read-only 模式

在这种情况下，均需进行介质恢复。

（二）、临时表空间

临时表空间并不包含真正的数据，恢复的方法是删除临时表空间并重建即可。

（三）、系统表空间

如果备份不可用，则只能采用重建数据库的方法

（四）、回滚表空间

有两种情况：

1、数据库已经完全关闭（使用shutdown immediate或shutdown命令）

1) 确认数据库完全关闭

2) 修改init.ora文件,注释"rollback-segment"

3) svrmgrl> startup restrict mount

4) svrmgrl> alter database datafile filename offline drop;

5) svrmgrl> alter database open;

基于出现的结果："statement processed" 转(7)；"ORA-00604,ORA-00376,ORA-01110"转(6)

6) svrmgrl> shutdown immediate

修改init.ora文件,增加如下一行：_corrupted_rollback_segments = (<roll1>,...<rolln>)

svrmgrl> startup restrict

7) svrmgrl> drop tablespace tablespace_name including contents;

8) 重建表空间及回滚段

9) svrmgrl> alter system disable restricted session;

10) 修改init.ora文件

2、数据库未完全关闭（数据库崩溃或使用shutdown abort命令关闭数据库）

1) 恢复备份

2) svrmgrl> startup mount

3) svrmgrl> select file#,name,status from v$datafile;

svrmgrl> alter database datafile filename online;

4) svrmgrl> select v1.group#,member,sequence#,first_change# from v$log v1,v$logfile v2 where v1.group#=v2.group#;

5) svrmgrl> select file#,change# from v$recover_file; #参见方案2-4

6) svrmgrl> recover datafile filename;

7) svrmgrl> alter database open;

3、数据库处于打开状态

1) 删除回滚段和表空间

2) 重建表空间和回滚段

（五）、控制文件恢复

1．所有的控制文件均被破坏

将备份的控制文件拷贝至原目录下，对于RAW DEVICE（裸设备），则：dd if='con.bak' of='/dev/rdrd/drd1' seek=128

2．并非所有的控制文件均被破坏，用其他的控制文件启动数据库

（六）、数据块及其中数据的挽救

现象：执行ORACLE操作时出现ORA-01578错误

分析：ORA-1578错误是当ORACLE认为一个数据块可能被破坏而发生的，通常引起该错误的原因有以下几种：

I/O的硬件或firmware损坏

操作系统I/O或cache故障

内存或页交换出错

部分数据文件被覆盖

试图访问未格式化块

磁盘修复

其他原因

解决步骤：

查看log以及trace文件，检查是否有其他错误发生

定位错误：

sql>select * from v$datafile where file#=<F>;

sql>select owner,segment_name,segment_type from dba_extents where file_id=<F> and <B> between block_id and block_id+blocks-1;

基于返回的segment_type：

segment类型为temporary或cache或无返回值，检查SQL语句是否正确。

segment类型为rollback segment，则数据块需要恢复。

segment类型为index，检查其所在的表。重建索引即可。

sql> select owner,table_name from dba_tables where cluster_name = name_of_segment

仍然出现1578错误，数据库需要恢复。

segment类型为表，拯救表中的数据。

分析一个实体是否有永久性数据破坏

sql> analyze table table.name validate structure cascade;

sql> analyze table clustername validate structure cascade;

硬件错误的恢复

数据库运行在ARCHIVE模式下

OFFLINE相应的数据文件

拷贝备份的数据文件

rename the datafile to new location

recover the datafile using archive log

online数据文件

数据库运行在非ARCHIVE模式下

OFFLINE相应数据文件

拷贝备份的数据文件，rename the datafile and online it

拯救表中数据

例如：sql>select * from bigemp;

ERROR：ORA-01578: ORACLE DATA block corrupted (file#8,block#8147) ORA-00110: data file 8: ‘/oracle/usr714.dbf’ … … corrupt file id : 8=8(hex) corrupt block id : 8147=1fd3(hex) first rowid in the corrupt block: 0000.1fd3.0000.0008 last rowid in the corrupt block: 0000.1fd2.7fff.0008 first rowid affer this block: 0000.1fd4.0000.0008

sql > create table temp as select * from bigemp where 1=2;

sql > insert into temp select * from bigemp /*+rowid(bigemp) */ where rowid >=’0000.1fd4.0000.0008’;

sql > insert into temp select * from bigemp where rowid <=’0000.1fd2.7fff.0008’;

在ORACLE 7.1以前版本，rowid range scan不存在时，可以通过索引达到以上相同的目的。

四、后记

ORACLE的备份恢复技术可以说是博大精深，我所了解的只是很少的一部分，而且还不是很透彻，希望这几篇文章对大家能有所帮助，也欢迎大家将自己遇到的备份和恢复的问题告诉我，我将它整理起来，发表在这里，供所有有兴趣做的DBA朋友和数据管理员参考，也许您的举手之劳会拯救一个公司！

同时，我还要提醒所有的朋友，备份是非常、非常、非常、非常、非常、非常、非常、非常、非常。。。重要的，有条件的话一定要采用ARCHIVE模式，否则，可能出了问题，哭都哭不出来。