本文主要介绍如何完成基于 DB2 的 PHP 应用系统从 AIX 平台到 Linux 平台的移植过程。文中包含了底层的 DB2 数据库移植、上层的 PHP 应用系统移植的详细步骤以及移植过程中可能遇到的问题和解决方法。
任务概述
系统迁移的工作主要分为以下几个方面:
1.DB2 数据库系统的跨平台迁移
2.Apache 服务器与 php 应用系统的安装和配置
下面我们就分 2 个方面分别介绍迁移和配置的具体步骤。
DB2 数据库系统的跨平台迁移
数据库环境
源环境:AIX+DB2 v8.1
目标环境:Linux+DB2 v8.1
其中源数据库中包含了 2 个数据库 Instance:SRCDB1 与 SRCDB2。在 SRCDB1/SRCDB2 数据库中,均包含了上百张数据库表,并有很多的索引、外键约束、触发器、存储过程以及一些含有自增字段的表(含有 GENERATED ALWAYS AS IDENTITY 定义字段的表)。更为困难的是,我们并没有关于这些数据库对象的准确创建脚本。
迁移方案的选择
如果迁移的源系统与目的系统属于同一类型操作系统,例如 Linux 之间的迁移,或者 AIX 系统之间的迁移,则情况相对简单,DB2 本身已经提供相关的实用工具来实现这种同类型平台之间的数据库移植,如: BACKUP 和 RESTORE 命令。当然,根据不同的情况还需要对实用工具所提供的参数有比较清楚的了解,譬如源系统与目标系统使用不同的表空间,就会涉及到表空间重定向的问题。由于本文的重点在于跨平台的移植,这种方案显然无法满足需求,在此不再熬述。
那么,如何处理跨平台的数据库迁移问题?是不是可以使用实用工具 db2move 呢? db2move 只能迁移表中的数据,而无法对索引、外键约束、触发器和存储过程等数据库对象也实现迁移操作,而且对于包含自增字段数据的表来说,db2move 也有一定的限制。并且 db2move 只能把数据导入到已存在的数据库的表中,无法显示指定表空间的位置。由于在数据库的系统迁移过程中,不仅需要迁移表中的数据,还有索引、外键约束、触发器和存储过程等数据库对象,与本文所选方案相比,还是后者更具优势。可以将 db2move 仅作为迁移表数据的一种备用方案。
而对于 export 和 import 来说,一次只能针对一张表进行导出导入操作,并且需要手动输入 export 和 import 的命令以及需要导入导出的数据表名,在数据库表的数量不多的情况下,这种方案也许还可以考虑,但也不并是最佳的方案。而在数据库中表数量众多的情况下,这种做法则是基本不现实的,而且 import 命令并不能保证自增字段的数据与原来的表数据保持一致。
本文根据 DB2 对数据库对象的处理机制,采用将 db2look 与 DDL、DML 脚本相结合的方式,并针对原数据库中的触发器、存储过程以及外键约束等分别处理,给出了一种跨平台 DB2 数据库系统移植的可行方案。
下面我们以 SRCDB1 为例介绍一下这种情况下的数据库整体迁移过程。SRCDB1 数据库中有 SRCDB1、ASN、DB2DBG 和 SQLDBA 这四个数据库模式。假设 SRCDB1 数据库的用户名为 user_srcdb1,密码:pw_srcdb1。
在源系统 (AIX) 上的相关操作
1.使用 db2look 命令抽取生成数据库对象的 DDL 脚本
清单 1. db2look 命令及参数
# db2look -d SRCDB1 -e -o srcdb1.ddl -a -i user_srcdb1 -w pw_srcdb1
db2look :生成 DDL 以便重新创建在数据库中定义的对象
语法: db2look -d DBname [-e] [-u Creator] [-z Schema]
[-t Tname1 Tname2...TnameN] [-tw Tname] [-h] [-o Fname] [-a]
[-m] [-c] [-r] [-l] [-x] [-xd] [-f] [-fd] [-td x]
[-noview] [-i userID] [-w password]
[-v Vname1 Vname2 ... VnameN] [-wrapper WrapperName]
[-server ServerName] [-nofed]
-d : 数据库名称,必选参数
-e : 抽取复制数据库所需要的 DDL 文件,此选项将生成包含 DDL 语句的脚本
-o : 将输出重定向到给定的文件名,如果未指定 -o 选项,则输出默认转到 stdout
-a : 为所有创建程序生成统计信息,如果指定了此选项,则将忽略 -u 选项
-i : 指定登录到数据库所在服务器时所使用的用户标识
-w : 指定登录到数据库所在服务器时所使用的密码
2.根据不同类型对象,分化数据库对象 DDL 脚本
由于源数据库中的各个表数据已经是经过触发器、存储过程等数据库对象处理过的数据,为保证数据库中数据的一致性和完整性,这些数据库对象应该在导入数据后再创建,以防止在导入表数据时重复执行触发器和存储过程等数据库对象生成错误数据。使用文本编辑器编辑由 db2look 生成的 srcdb1.ddl,将创建表及索引的 DDL 语句,创建外键约束的 DDL 语句以及创建触发器和创建存储过程的语句分为四组,分别保存为下面四个 DDL 脚本:
srcdb1_tables.ddl srcdb1_foriegnkeys.ddl
srcdb1_triggers.ddl srcdb1_procedures.ddl
srcdb1_tables.ddl :包含创建 SEQUENCE,UDF,TABLE,VIEW 等数据库对象的 ddl 语句。
清单2. srcdb1_tables.ddl 语句
CREATE SEQUENCE "SRCDB1"."SAMPLE_SEQ_1" AS INTEGER
MINVALUE 1 MAXVALUE 9999999999
START WITH 1 INCREMENT BY 1;
CREATE FUNCTION " SRCDB1"." SAMPLE _FUNC_1"
(
VARCHAR(254),
VARCHAR(254),
VARCHAR(254)
) RETURNS VARCHAR(254)
SPECIFIC SAMPLE _FUNC_1 ……;
CREATE TABLE " SRCDB1"." SAMPLE _TAB_1" (
"TAB_COL1" CHAR(20) NOT NULL ,
"TAB_COL2" VARCHAR(70) NOT NULL ) ;
CREATE TABLE " SRCDB1"." SAMPLE _TAB_2" (……);
……
CREATE TABLE " SRCDB1"." SAMPLE _TAB_N" (……);
CREATE VIEW SRCDB1.SAMPLE_VIEW_1 (VIEW_COL1,VIEW_COL2) AS SELECT distinct
COL1 , COL2 FROM SAMPLE_TAB WHERE ……;
CREATE VIEW SRCDB1.SAMPLE_VIEW_2 ……;
……
CREATE VIEW SRCDB1.SAMPLE_VIEW_N ……;
srcdb1_foriegnkeys.ddl :包含创建外键约束的 ddl 语句。
清单3. srcdb1_foriegnkeys.ddl 语句
ALTER TABLE " SRCDB1"."SAMPLE_FK_1"
ADD CONSTRAINT "SQL030903143850120" FOREIGN KEY
("FK_COL1")
REFERENCES " SRCDB1"."SAMPLE_TABLE"
("COL1");
ALTER TABLE " SRCDB1"."SAMPLE_FK_2" ADD ……;
……
ALTER TABLE " SRCDB1"."SAMPLE_FK_N" ADD ……;
srcdb1_triggers.ddl :包含创建触发器的 ddl 语句。
清单 4. srcdb1_triggers.ddl 语句
CREATE TRIGGER SRCDB1.SAMPLE_TRIG_1 AFTER UPDATE OF col1 ON SRCDB1.SAMPLE_TAB
REFERENCING NEW AS n FOR EACH ROW MODE DB2SQL WHEN ( n.col1 > 3)
BEGIN ATOMIC
update SAMPLE_TAB
set(col2) = 'anotherValue' where col1 = n.col1 ;--
END;
CREATE TRIGGER SRCDB1. SAMPLE_TRIG_2 ……;
……
CREATE TRIGGER SRCDB1. SAMPLE_TRIG_N ……;
srcdb1_procedures.ddl :包含创建 SQL 存储过程以及 java 存储过程的 ddl 语句。
清单 5. srcdb1_procedures.ddl语句
CREATE PROCEDURE " SRCDB1"." JAVA_PROCEDURE_1"
(
OUT SQLSTATE CHARACTER(5),
OUT ROWS_SUBMITED INTEGER,
IN BATCH_ID INTEGER,
IN LEVEL VARCHAR(4000)
)
DYNAMIC RESULT SETS 0
SPECIFIC SUBMIT_BATCH
EXTERNAL NAME 'Submit_batch!submit_batch'
LANGUAGE JAVA
PARAMETER STYLE JAVA
NOT DETERMINISTIC
FENCED THREADSAFE
MODIFIES SQL DATA
NO DBINFO;
CREATE PROCEDURE " SRCDB1"."JAVA_PROCEDURE_2" ……;
……
CREATE PROCEDURE " SRCDB1"."JAVA_PROCEDURE_N" ……;
SET CURRENT SCHEMA = " SRCDB1";
SET CURRENT PATH = "SYSIBM","SYSFUN"," SRCDB1";
CREATE PROCEDURE SRCDB1.SQL_PROCEDURE_1 (
IN hostname varchar(4000),
IN username varchar(4000),
OUT SQLCODE_OUT int )
SPECIFIC SRCDB1.SQL_PROCEDURE_1
LANGUAGE SQL
-------------------------------------------------
-- SQL Stored Procedure
-------------------------------------------------
P1: BEGIN
……
END P1 ;
CREATE PROCEDURE SRCDB1.SQL_PROCEDURE_2 ……;
……
CREATE PROCEDURE SRCDB1.SQL_PROCEDURE_N ……;
需要注意的是,db2 v6 版本的 db2look 尚未实现抽取如 UDF,TRIGGER,UserSpace,NodeGroup,BufferPool 等数据库对象的 ddl 语句。从 db2 v7 开始,db2look 可以抽取上述对象的 DDL,但是依然无法抽取创建存储过程对象的 ddl 语句。从 db2 v8.2 开始,完善了对 db2look 功能的支持,实现了存储过程 ddl 语句的抽取功能。由于本文所涉及的源数据库系统的版本较低(DB2 v8.1),因此需要采取上述方案获取所有数据库对象的 DDL 信息:
1). 从某个 DB2 v8.2 系统对 SRCDB1(DB2 v8.1 版本)执行 CATALOG 操作:
db2 catalog db SRCDB1 as SRCDB1;
2). 从 DB2 v8.2 系统对 SRCDB1 进行 db2look 抽取过程:
db2look -d SRCDB1 -e -o srcdb1.ddl -a -i user_srcdb1 -w pw_srcdb1;
这样就可以获取完整的数据库对象 DDL 信息。
3.生成数据导出export脚本
使用 shell 脚本生成并导出所有数据的 DML 脚本,并将其重定向到 srcdb1_export.sql 文件中。对于熟悉 DB2 的用户来说,应该知道数据库中创建的每个表、视图、别名均对应 SYSCAT.TABLES 中一行记录。因此可以通过相应的数据库 select 语句就可以获取所有需要的数据库表信息。根据需要,下述 shell 脚本将从系统表 SYSCAT.TABLES 中根据 tabname 字段选出 SRCDB1 中所有 tabschema 表模式是 SRCDB1,ASN,SQLDBA,DB2DBG 的表名字,并根据它们的名字生成相应的 export 导出语句,到达批量导出的目的。rtrim 函数用于去除 tabname 字段数据的右边的空格。
清单6. 生成export脚本
# db2 "select 'export to ' || rtrim(tabname) || '.ixf of ixf select * from ' ||
rtrim(tabname) || ';' from syscat.tables
where tabschema in('SRCDB1', 'ASN', 'SQLDBA', 'DB2DBG')" > srcdb1_export.sql ;
编辑生成的 srcdb1_export.sql,删除头部和尾部所显示的统计信息,只保留必要的 export 语句。通过修改上述脚本中所包含的 tabschema 信息,可以指定需要导出的表的范围,也即迁移过程中需要的所有表名。所生成的 export 导出语句具有如下的命令形式:
db2 export to tablename.ixf of ixf select * from tablename;
4.生成数据导入 load 脚本
使用 shell 脚本生成 load 脚本用于将数据导入目标系统:srcdb1_load.sql
清单7. 生成 load 脚本
# db2 "select 'load from ' || rtrim(tabname) || '.ixf of ixf insert into ' ||
rtrim(tabname) || ';' from syscat.tables
where tabschema in ('SRCDB1', 'ASN', 'SQLDBA', 'DB2DBG')" > srcdb1_load.sql;
编辑生成的 srcdb1_load.sql,删除头部和尾部的统计信息,只保留必要的 load 语句。与 export 导出语句类似,上述 shell 脚本从系统表中选出 SRCDB1 中所有表的名字,并根据它们的名字生成相应的 import 导入语句,到达批量导入的目的。所生成的 import 导入语句命令形式如下:
db2 load from tablename.ixf of ixf insert into tablename;
5.处理数据库表中的自增字段
对于需要加载的含有自增字段的表,即该表的 ixf 数据文件中有自增列的值, 可以在 load 命令中加入如下参数控制自增字段值:
1). modified by identityignore :加载的数据文件中有自增字段值,load 时忽略数据文件中自增字段值 ;
2). modified by identitymissing :加载的数据文件中没有自增字段值,load 时自动生成自增字段值 ;
3). modified by identityoverride :加载的数据文件中有自增字段值,load 时使用数据文件中的自增字段值 。
为了使目标数据库中含有自增字段的表中数据与源数据库中的数据保持一致,本文实例中选择使用 modified by identityoverride 参数,在导入数据时使用数据文件中的自增字段值。读者可以根据不同情况选择适当的控制参数。
首先,在 srcdb1_tables.ddl 文件中查找所有包自增字段的表名 ( 含有 GENERATED ALWAYS AS IDENTITY 字段的表 ),然后在 srcdb1_load.sql 中将 modified by identityoverride 语句片段插入到这些含有自增字段的表所对应的 load 命令行中。
清单8. load 脚本中自增字段处理
db2 load from test.ixf of ixf modified by identityoverride insert into TEST;
6.执行导出脚本
执行导出脚本,导出所有表的数据 。
# db2 -tvf srcdb1_export.sql
导出的表数据以 ixf 格式存放于当前路径下。
7.保存脚本和数据文件
将所有 DDL 脚本以及数据文件 *.ixf 复制到目标系统所在站点。
LINUX 系统上的操作
1.通过命令行处理器(CLP)创建实例 SRCDB1:
# db2icrt SRCDB1
2.使用 CREATE DATABASE 命令创建数据库 SRCDB1,创建必要的表空间及配置必要的数据库参数。
# db2 create database SRCDB1
3.连接到数据库 SRCDB1,执行 srcdb1_tables.ddl 脚本创建缓冲池,表空间,UDF,表以及 Index,Sequence,视图等数据库对象。
# db2 connect to srcdb1
# db2 -tvf srcdb1_tables.ddl
4.进入到放置 .ixf 数据文件的目录,执行下面的命令导入表数据。
# db2 -tvf srcdb1_load.sql
5.使用 srcdb1_foriegnkeys.ddl,srcdb1_triggers.ddl ,srcdb1_procedures.ddl 脚本文件创建外键约束,触发器和存储过程。
# db2 -tvf srcdb1_foriegnkeys.ddl
# db2 -tvf srcdb1_triggers.ddl
# db2 -tvf srcdb1_procedures.ddl
成功完成上述步骤后,数据库的迁移工作基本完成。
Apache 服务器与 php 的安装和配置
Apache 服务器的安装和配置
Apache HTTP 服务器是一个模块化的软件,管理员可以通过选择服务器中包含的模块进行功能增减。模块可以在编译时被静态包含进httpd二进制文件,也可以编译成独立于httpd二进制文件的动态共享对象 (DSO)。DSO 模块可以与服务器一起编译,也可以用 Apache 扩展工具 (apxs) 单独编译。动态加载的方式相比静态加载具有更高的灵活性。使用动态载入特性,Apache 服务器必须以动态共享对象(DSO,Dynamic Shared Object)的方式编译。Apache 对 DSO 的支持,是基于一个叫 mod_so 的模块来实现的,为支持动态加载方式,这个模块必须预先被静态编译到内核中。因此可以通过 mod_so 模块检测已安装的 Apache 是否支持 DSO:
清单9. mod_so 模块检测
# $APACHEHOME/bin/httpd –l
Compiled in modules:
core.c
prefork.c
http_core.c
mod_so.c
如果在列出的模块名中有 mod_so.c,则说明安装的 Apache 已经支持 DSO,否则需要重新编译 Apache。Apache 的安装和配置过程十分简单,如下所示:
1.下载 httpd-2.0.54.tar.gz(http://httpd.apache.org/),并将其解压到制定目录
# tar zxvf httpd-2.0.54.tar.gz && cd httpd-2.0.54
2.编译安装 apache
# ./configure --prefix=/usr/local/apache2 --enable-module=so
-- prefix 指定 apache 的安装路径
--enable-module=so 将 so 模块(mod_so)静态编译进 apache 服务器的内核,以支持 DSO 模式
# make && make install
3. 启动 apache
# ln -s /usr/local/apache2/bin/apachectl /sbin/apachectl
# apachectl start
php 的安装和配置
在 php 的安装和配置过程中,有两个方面需要注意,首先是 php 与 apache http server 的结合,其次是 php 与 db2 数据源的连接。
在 Apache 环境下安装 PHP 的时候,有三种安装模式可供选择:静态模块、动态模块(DSO)和 CGI。建议以 DSO 模式安装,这种模式的维护和升级都相对简单,可以在无需重新编译 Apache 的条件下,根据需求动态增加新功能模块。当然,这样做也会带来一些运行效率上的下降,Apache 服务器在启动时会慢约 20%。
PHP 连接 DB2 数据源同样有三种方式 : unified ODBC driver、IBM_DB2 和 PDO(php data object)。
◆unified ODBC driver 是最早的 PHP 访问数据库的扩展模块之一。从 DB2 v7.2 开始,unified ODBC driver 就支持对其的访问。对所有支持 ODBC 的数据库,unified ODBC driver 提供了统一的数据访问接口。为了保证接口的一般性,unified ODBC driver 并未对不同类型的数据库做特定的优化。
◆IBM_DB2 是由 IBM 开发和维护的与 DB2 数据源交互的扩展模块,它遵守开源协议。对基于 DB2 UDB 和 php 4.x 的应用来说,IBM_DB2 是最优的选择,因为它针对 DB2 UDB 进行了优化,同时避免了一些使用 unified ODBC driver 时可能存在的兼容性问题。不过,IBM_DB2 只支持 DB2 v8.2.2 或更高版本。
◆PDO 则是 php 5.x 中即将支持的新的数据库访问方式。本文中,由于源数据库与目标数据库的版本均为 DB2 v8.1,并且源环境中采用 unified ODBC driver 的方式,为了保持环境配置的一致性,仍然选择 unified ODBC driver 作为 php 与数据源的访问接口。
PHP 的安装与配置过程具体如下:
1.下载并解压 php-4.4.4.tar.gz(http://www.php.net/)
# tar zxvf php-4.4.4.tar.gz
# cd php-4.4.4
2.配置编译 php 源代码
# ./configure --prefix=/usr/local/php --with-apxs2=/usr/sbin/apxs --without-mysql --with-ibm-db2=/home/reportdb/sqllib
--prefix 指定 php 的安装路径
--with-apxs2 指定 apxs 程序的路径 (apxs 是一个 perl 脚本,它可以脱离 apache 的源码将 php 模块编译成 DSO 文件 )
--with-ibm-db2 指定 unified ODBC driver 作为 php 与数据源的访问接口,并指定 DB2 的实例安装目录。
--without-mysql 忽略 mysql 数据库缺省的安装配置
#cp php.ini-dist /usr/local/lib
将 php 安装文件中的 php.ini-dist 拷贝到 /usr/local/lib 下作为 php 的配置文件。
# make && make install
# cp php.ini-dist /usr/local/lib/php.ini
3.编辑 /usr/local/apache2/conf/httpd.conf 文件,做如下修改:
设置 html 文件主目录:用于存放网站所需 web 文件的主目录
DocumentRoot "/home/web/www/"
设置 apache 的默认文件名的次序: apache 将按照由前至后的顺序在当前路径下查找其所支持的默认主页文件
DirectoryIndex index.php index.html.var index.cgi index.html
添加 php 解释文件后缀:对于所有需要被 PHP 解释的文件类型,需要将后缀添加至 AddType 配置项
AddType application/x-httpd-php .php .inc
加载 PHP 模块:加载模块目录 modules 下的库 libphp4.so,并将模块结构名 php4_module 添加到活动模块列表中
LoadModule php4_module modules/libphp4.so
4.编辑配置文件 /usr/local/apache2/bin/apachectl :
为保证与 DB2 数据库的连通,启动 Apache 服务时,需要同时初始化 DB2 客户机实例环境。创建 DB2 实例时,DB2 会自动生成 shell 脚本用于初始化所需的 DB2 实例环境,只需直接调用即可:
if test -f /home/reportdb/sqllib/db2profile; then
. /home/reportdb/sqllib/db2profile
fi
5.然后,重新启动 Apache 服务器以继承上面的配置更改。
# apachectl restart
6.编写 PHP 的测试文件 test.php,内容如下:
echo phpinfo();
?>
将其存放在 apache 的 html 文件主目录 /home/web/www 下,通过浏览器访问该网页,若能正常访问(如下图所示),则配置工作全部完成。
结束语
本文主要涵盖了一个基于 php 和 DB2 UDB 的应用系统的跨平台移植过程,详细介绍了 DB2 数据库系统的跨平台迁移以及 Apache 服务器与 php 应用系统的安装和配置过程。基于实践经验,为 DB2 数据库系统的跨平台迁移问题提供了一个可行的解决方案。对于移植过程中可能出现的问题,本文也给予详细的描述并提供相应的解决方案。虽然本文所涉及的只是从 AIX 系统到 LINUX 系统的应用系统移植过程,读者亦可以参考具体的移植过程,将其应用于其它平台之上。