Oracle 数据库向 MS SQL Server 7.0 的迁移(2)

索引数据存储参数

Microsoft SQL Server 中 FILLFACTOR 选项和 Oracle 中的 PCTFREE 变量的作用基本相同。随着表的增大，索引页就会拆分，以容纳新数据。索引必须重新组织，来容纳新的数据值。填充因子百分比只在索引创建时使用，以后不再维护。

在索引最初创建时，FILLFACTOR 选项（值从 0 到 100 ）控制索引页上保留多少空间。假如没有指定，使用默认的填充因子 0 - 这将完全填充索引叶级页，并在每个决定节点页上保留至少一个条目的空间（对于非唯一的聚集索引保留两个）。

使用较低的填充因子值，最初会减少索引页的拆分，并增加 B 树索引结构中级别的数目。使用较高的填充因子值，可更有效地使用索引页空间，访问索引数据需要较少的磁盘 I/O，并减少了 B 树索引结构中级别的数目。

PAD_INDEX 选项指定了，将填充因子应用到索引的决定节点页以及数据页中。

尽管在 Oracle 中，必须调整 PCTFREE 参数来优化性能，但在 CREATE INDEX 语句中，一般不需要加入 FILLFACTOR 选项。填充因子可用于优化性能。仅当使用现有数据在表上创建新索引，并且能够准确预估该数据以后的变化时，填充因子才是有用的。

假如已经把 Oracle 索引的 PCTFREE 设为 0，则考虑使用值为 100 的填充因子。它用于不发生插入和更新的表（只读表）。填充因子设为 100 时，SQL Server 创建每页均百分之百填充的索引。

忽略重复的要害字

对于 Oracle 和 Microsoft SQL Server，用户不能向唯一索引的列插入重复的值。假如这样做，就会产生错识消息。但是，使用 SQL Server，开发人员可以选择 INSERT 或 UPDATE 语句对该错误作出何种反应。

假如在 CREATE INDEX 语句中指定了 IGNORE_DUP_KEY，并执行了产生重复键的 INSERT 或 UPDATE 语句，SQL Server 就会发出一条警告消息，并忽略（不插入）此重复的行。假如没有给索引指定 IGNORE_DUP_KEY，SQL Server 就会发出一个错误信息，并回滚整个 INSERT 语句。有关这些选项的具体信息，请参见 SQL Server Books Online。

Oracle 应用程序可能需要创建只存在很短时间的表。应用程序必须确保，在某些时候可以删除所有为此目的创建的表。假如应用程序做不到这一点，表空间很快就会变得混乱和难以治理。

Microsoft SQL Server 提供了临时表数据库对象，它正是为此目的创建的。这些表总是创建在 tempdb 数据库中。表名称决定了它们在 tempdb 数据库中保留多长时间。

可以给临时表定义索引。仅能在 tempdb 中显式创建且不带有 # 或 ## 前缀的表上定义视图。下面的例子给出了，如何创建一个临时表及其相关索引。用户退出时，表和索引被自动删除。

SELECT SUM(ISNULL(TUITION_PAID,0)) SUM_PAID, MAJOR INTO #SUM_STUDENT

FROM USER_DB.STUDENT_ADMIN.STUDENT GROUP BY MAJOR

CREATE UNIQUE INDEX SUM STUDENT IDX ON #SUM STUDENT (MAJOR)

您可能会发现，使用临时表带来了很多优势，完全有理由为此而修改程序代码。

Microsoft SQL Server 有一些比 Oracle 更为强健的数据类型。Oracle 和 SQL Server 数据类型之间有多种转换方式。建议使用 DTS 向导自动创建新的 CREATE TABLE 语句。必要时，可修改这些语句。

使用 Unicode 数据

Unicode 规范给世界各地广泛使用的几乎所有字符定义了统一的编码方案。所有计算机使用该 Unicode 规范，将 Unicode 数据中的位模式统一转换为字符。这就保证了在所有的计算机上，相同的位模式总是转换成相同的字符。数据可以从一个数据库或计算机自由地传输到另一个上，而不必担心接收系统不能把位模式正确转换为字符。

对于每个字符使用 1 个字节编码的数据类型来说，一个问题是这种数据类型只能表示 256 个不同的字符。这就要求对于不同的字母表，必须采用多个编码规范（或代码页）。它也不能处理像日语 Kanji 或韩国语 Hangul 字母表这样有几千个字符的系统。

Microsoft SQL Server 使用与 SQL Server 一起安装的代码页中的定义，将 char、varchar 和 text 列中的位模式转换成字符。客户计算机使用与操作系统一起安装的代码页解释位模式。

有许多种不同的代码页。有些字符在一些代码页中，但不在其它代码页中。有些字符在一些代码页中用一种位模式定义，在其它代码页中则使用另一种位模式。当创建必须处理各种语言的国际化系统时，要为所有计算机挑选满足多个国家语言要求的代码页，就变得十分困难。而且也很难保证，所有计算机与使用不同代码页的系统交互时，能够进行正确转换。

在 Unicode 规范中，每个字符使用 2 字节编码，从而解决了这一问题。两字节中有足够多的不同模式 (65,536)，可以使单一规范涵盖大多数通用的商务语言。因为所有的 Unicode 系统均使用相同的位模式表示所有字符，当字符从一个系统迁移到另一个系统时，不会出现字符转换错误的问题。

在 SQL Server 中，nchar、nvarchar 和 ntext 数据类型均支持 Unicode 数据。有关 SQL Server 数据类型的具体信息，请参见 SQL Server Books Online。

用户定义的数据类型。

可为 model 数据库或单个用户数据库创建用户定义的数据类型。假如用户定义的数据类型是为 model 定义的，此后创建的所有新用户数据库均可使用该数据类型。用户定义的数据类型是用 sp_addtype 系统存储过程定义的。有关具体信息，请参见 SQL Server Books Online。

可以在 CREATE TABLE 和 ALTER TABLE 语句中使用用户定义的数据类型，并将其与默认值和规则绑定在一起。表创建过程中，假如使用用户定义的数据类型时，明确地定义了为空性，则它优先于数据类型创建时定义的为空性。

此例给出了，如何创建一个用户定义的数据类型。参数为用户类型名称、数据类型和为空性。

sp_addtype gender_type, 'varchar(1)', 'not null'

乍看起来，此功能解决了 Oracle 表创建脚本向 SQL Server 迁移的问题。比如，可以方便地增添 Oracle DATE 数据类型：

sp_addtype date, datetime

但对于需要大小可变的数据类型，例如 Oracle 数据类型 NUMBER，则没有什么用处。返回的错误消息表明，长度也必须指定。

sp_addtype varchar2, varchar

Msg 15091, Level 16, State 1

You must specify a length with this physical type.

Microsoft timestamp（时间戳）列

timestamp 列答应 BROWSE 模式更新，并使游标更新操作更为有效。timestamp 是一种数据类型，每次包含 timestamp 列的行被插入或更新时，它都会自动更新。

timestamp 中的值不是作为实际的日期或时间存储的，而是以 binary(8) 或 varbinary(8) 存储的，它表示表中行的事件序列。一个表只能有一个 timestamp 列。

有关具体信息，请参见 SQL Server Books Online。

Microsoft SQL Server 对象的权限可以授予给其它数据库用户、数据库组和 public 角色，也可以被其拒绝或撤销。与 Oracle 不同，SQL Server 不答应对象所有者给对象授予 ALTER TABLE 和 CREATE INDEX 权限。这些权限必须只属于对象所有者。

GRANT 语句在安全系统中创建一个条目，答应当前数据库中的用户处理当前数据库中的数据或执行特定的 Transact-SQL 语句。在 Oracle 和 SQL Server 中，GRANT 语句的语法是相同的。

DENY 语句在安全系统中创建一个条目，拒绝当前数据库中安全帐户的权限，并禁止安全帐户以组或角色成员身份继续权限。Oracle 没有 DENY 语句。REVOKE 语句撤销以前授予当前数据库中一个用户的权限或被其拒绝的权限。

有关对象级权限的具体信息，请参见 SQL Server Books Online。

在 Oracle 中，REFERENCES 权限只能授予一个用户。SQL Server 则答应将 REFERENCES 权限授予数据库用户和数据库组。在 Oracle 和 SQL Server 中，INSERT、UPDATE、DELETE 和 SELECT 权限授予的方式相同。

实施数据完整性和业务规则

实施数据完整性确保了数据库中数据的质量。在表的规划中，有两个重要的步骤，即识别列的有效值，以及确定如何在列中实施数据完整性。数据完整性可以分为四个类别，并用不同的方法来实施。

实体完整性把一行定义为特定表的一个单独实体。实体完整性通过索引、UNIQUE 约束、PRIMARY KEY 约束或 IDENTITY 属性，来实施表的标识符列或主键的完整性。

约束的命名

应该始终显式命名约束。假如没有，则 Oracle 和 Microsoft SQL Server 使用不同的命名规则隐式命名约束。这些命名上的差别会给迁移过程带来不必要的麻烦。在删除或禁用约束时，就会造成不一致，因为必须使用名称，约束才能被删除。对于 Oracle 和 SQL Server 来说，显式命名约束的语法是相同的。

CONSTRAINT constraint_name

主键和唯一列

SQL-92 标准要求，主键中的所有值应该唯一，并且该列不答应有空值。

一旦定义了 PRIMARY KEY 或 UNIQUE 约束，Oracle