不同平台DB2数据库之间大批量的移动数据(二)——Load篇
在前面一篇文章中我介绍了Export/Import在数据交换中的使用方法。在本次我将详细介绍另外一种导入数据的工具LOAD(装载)的使用。
Load的功能与Import类似,但实现方式上有比较大的区别。Load会把要导入的数据格式化为数据页,并利用并行I/O写入数据。这种机制允许进行比 IMPORT 实用程序更有效的数据移动。这样用Load在处理大批量数据导入的时候实际上是比Import效率高很多。不过,Load实用程序不执行某些操作,如引用或表约束检查以及触发器调用。因为Load工具修改不记入日志,所以不能使用日志文件前滚。
以下是 LOAD 命令的核心;该命令还支持其它一些选项和修饰符,具体参数请查阅相应指南手册Command Reference。要成功地执行该命令,就必须具有 SYSADM、DBADM 或 LOAD 权限,或者对装入过程中所涉及的表具有 INSERT 和/或 DELETE 特权。
LOAD FROM input_source OF input_type
MESSAGES message_file
[ INSERT | REPLACE | TERMINATE | RESTART ]
INTO target_tablename
Load所支持的文件类型在上一篇中已经介绍了。不过,Load操作不支持WSF类型的文件作为数据导入文件。另外LOAD 的源输入的格式可以是CURSOR(游标),它是从 SELECT 语句返回的结果集。示例显示如下:
DECLARE mycursor CURSOR FOR SELECT col1, col2, col3 FROM tab1;
LOAD FROM mycursor OF CURSOR INSERT INTO newtab;
装入目标必须存在,该实用程序才能启动。这个目标可以是表、类型表或表别名。不支持向系统表或临时表进行装入。
LOAD 可以以四种不同方式执行:
INSERT 方式将输入数据添加到表中,不更改现有表数据。
REPLACE 方式从表中删除全部现有数据,然后用输入数据填充该表。
TERMINATE 方式终止装入操作,然后回滚到装入操作的起始点。一个例外是:如果指定了 REPLACE 方式,那么表将会被截断。
RESTART 方式用于重新启动以前中断的装入。它将自动从上一个一致性点继续操作。要使用该方式,请指定与前面的 LOAD 命令中相同的选项,但却使用 RESTART 方式。它允许该实用程序找到在装入处理期间生成的所有必需临时文件。因此,除非能够确信不需要从装入生成的临时文件,否则就不要以手工方式除去任何这类文件,这一点十分重要。一旦装入不出任何错误地完成,临时文件就会被自动除去。缺省情况下,临时文件是在当前工作目录中创建的。可以使用 TEMPFILES PATH 选项指定存储临时文件的目录。
完整的装入过程分为四个不同阶段。
装入阶段:
将数据装入表中。
收集索引键和表统计信息。
记录一致性点。
将无效数据放入转储文件,并在消息文件中记录消息。当数据行与表的定义不一致时,这些数据行就被认为是无效数据,并会被拒绝(不装入表中)。请使用 dumpfile 修饰符来指定文件的名称和位置,以记录任何被拒绝的行。
构建阶段:
根据装入阶段所收集的键创建索引。 如果在构建阶段发生错误,载入工具就重启(需要带RESTART选项),它将从构建阶段开始处重新开始。
删除阶段:
删除导致违反键唯一性的那些行,并将这些行放入异常表中。除了如上所述有些数据只是不满足目标表的定义之外,还有一些数据已经通过了装入阶段,但却违反了表中定义的唯一性约束。注:这里只将违反键唯一性的行作为坏数据;目前不检查其它约束。由于这类数据已经装入了表中,因此 LOAD 实用程序将在此阶段删除违规行。异常表可以用来存储被删除的行,使您可以决定在装入操作完成之后如何处理它们。如果没有指定异常表,那么就删除违规行,而不做任何跟踪,下面对异常表进行了更详细的讨论。
在消息文件中记录消息。
索引复制阶段:
如果 ALLOW READ ACCESS 是用 USE TABLESPACE 选项指定的,那么就会将索引数据从系统临时表空间复制到索引应该驻留的表空间。
Load过程的所有阶段都是操作的一部分,只有在所有这四个阶段完全成功后,该操作才算完成。在每个阶段Load工具都会生成消息。一旦这其中的一个阶段发生错误,这些消息就可以帮助我们分析并解决问题。
最后,总结下前面所说的;比较一下Load和Import
IMPORT vs. LOAD