索引数据存储参数
Microsoft SQL Server 中 FILLFACTOR 选项和 Oracle 中的 PCTFREE 变量的作用基本相同。随着表的增大,索引页就会拆分,以容纳新数据。索引必须重新组织,来容纳新的数据值。填充因子百分比只在索引创建时使用,以后不再维护。
在索引最初创建时,FILLFACTOR 选项(值从 0 到 100 )控制索引页上保留多少空间。假如没有指定,使用默认的填充因子 0 - 这将完全填充索引叶级页,并在每个决定节点页上保留至少一个条目的空间(对于非唯一的聚集索引保留两个)。
使用较低的填充因子值,最初会减少索引页的拆分,并增加 B 树索引结构中级别的数目。使用较高的填充因子值,可更有效地使用索引页空间,访问索引数据需要较少的磁盘 I/O,并减少了 B 树索引结构中级别的数目。
PAD_INDEX 选项指定了,将填充因子应用到索引的决定节点页以及数据页中。
尽管在 Oracle 中,必须调整 PCTFREE 参数来优化性能,但在 CREATE INDEX 语句中,一般不需要加入 FILLFACTOR 选项。填充因子可用于优化性能。仅当使用现有数据在表上创建新索引,并且能够准确预估该数据以后的变化时,填充因子才是有用的。
假如已经把 Oracle 索引的 PCTFREE 设为 0,则考虑使用值为 100 的填充因子。它用于不发生插入和更新的表(只读表)。填充因子设为 100 时,SQL Server 创建每页均百分之百填充的索引。
忽略重复的要害字
对于 Oracle 和 Microsoft SQL Server,用户不能向唯一索引的列插入重复的值。假如这样做,就会产生错识消息。但是,使用 SQL Server,开发人员可以选择 INSERT 或 UPDATE 语句对该错误作出何种反应。
假如在 CREATE INDEX 语句中指定了 IGNORE_DUP_KEY,并执行了产生重复键的 INSERT 或 UPDATE 语句,SQL Server 就会发出一条警告消息,并忽略(不插入)此重复的行。假如没有给索引指定 IGNORE_DUP_KEY,SQL Server 就会发出一个错误信息,并回滚整个 INSERT 语句。有关这些选项的具体信息,请参见 SQL Server Books Online。
Oracle 应用程序可能需要创建只存在很短时间的表。应用程序必须确保,在某些时候可以删除所有为此目的创建的表。假如应用程序做不到这一点,表空间很快就会变得混乱和难以治理。
Microsoft SQL Server 提供了临时表数据库对象,它正是为此目的创建的。这些表总是创建在 tempdb 数据库中。表名称决定了它们在 tempdb 数据库中保留多长时间。
可以给临时表定义索引。仅能在 tempdb 中显式创建且不带有 # 或 ## 前缀的表上定义视图。下面的例子给出了,如何创建一个临时表及其相关索引。用户退出时,表和索引被自动删除。
SELECT SUM(ISNULL(TUITION_PAID,0)) SUM_PAID, MAJOR INTO #SUM_STUDENT
FROM USER_DB.STUDENT_ADMIN.STUDENT GROUP BY MAJOR
CREATE UNIQUE INDEX SUM STUDENT IDX ON #SUM STUDENT (MAJOR)
您可能会发现,使用临时表带来了很多优势,完全有理由为此而修改程序代码。
Microsoft SQL Server 有一些比 Oracle 更为强健的数据类型。Oracle 和 SQL Server 数据类型之间有多种转换方式。建议使用 DTS 向导自动创建新的 CREATE TABLE 语句。必要时,可修改这些语句。
使用 Unicode 数据
Unicode 规范给世界各地广泛使用的几乎所有字符定义了统一的编码方案。所有计算机使用该 Unicode 规范,将 Unicode 数据中的位模式统一转换为字符。这就保证了在所有的计算机上,相同的位模式总是转换成相同的字符。数据可以从一个数据库或计算机自由地传输到另一个上,而不必担心接收系统不能把位模式正确转换为字符。
对于每个字符使用 1 个字节编码的数据类型来说,一个问题是这种数据类型只能表示 256 个不同的字符。这就要求对于不同的字母表,必须采用多个编码规范(或代码页)。它也不能处理像日语 Kanji 或韩国语 Hangul 字母表这样有几千个字符的系统。
Microsoft SQL Server 使用与 SQL Server 一起安装的代码页中的定义,将 char、varchar 和 text 列中的位模式转换成字符。客户计算机使用与操作系统一起安装的代码页解释位模式。
有许多种不同的代码页。有些字符在一些代码页中,但不在其它代码页中。有些字符在一些代码页中用一种位模式定义,在其它代码页中则使用另一种位模式。当创建必须处理各种语言的国际化系统时,要为所有计算机挑选满足多个国家语言要求的代码页,就变得十分困难。而且也很难保证,所有计算机与使用不同代码页的系统交互时,能够进行正确转换。
在 Unicode 规范 中,每个字符使用 2 字节编码,从而解决了这一问题。两字节中有足够多的不同模式 (65,536),可以使单一规范涵盖大多数通用的商务语言。因为所有的 Unicode 系统均使用相同的位模式表示所有字符,当字符从一个系统迁移到另一个系统时,不会出现字符转换错误的问题。
在 SQL Server 中,nchar、nvarchar 和 ntext 数据类型均支持 Unicode 数据。有关 SQL Server 数据类型的具体信息,请参见 SQL Server Books Online。
用户定义的数据类型。
可为 model 数据库或单个用户数据库创建用户定义的数据类型。假如用户定义的数据类型是为 model 定义的,此后创建的所有新用户数据库均可使用该数据类型。用户定义的数据类型是用 sp_addtype 系统存储过程定义的。有关具体信息,请参见 SQL Server Books Online。
可以在 CREATE TABLE 和 ALTER TABLE 语句中使用用户定义的数据类型,并将其与默认值和规则绑定在一起。表创建过程中,假如使用用户定义的数据类型时,明确地定义了为空性,则它优先于数据类型创建时定义的为空性。
此例给出了,如何创建一个用户定义的数据类型。参数为用户类型名称、数据类型和为空性。
sp_addtype gender_type, 'varchar(1)', 'not null'
go
乍看起来,此功能解决了 Oracle 表创建脚本向 SQL Server 迁移的问题。比如,可以方便地增添 Oracle DATE 数据类型:
sp_addtype date, datetime
但对于需要大小可变的数据类型,例如 Oracle 数据类型 NUMBER,则没有什么用处。返回的错误消息表明,长度也必须指定。
sp_addtype varchar2, varchar
Go
Msg 15091, Level 16, State 1
You must specify a length with this physical type.
Microsoft timestamp(时间戳)列
timestamp 列答应 BROWSE 模式更新,并使游标更新操作更为有效。timestamp 是一种数据类型,每次包含 timestamp 列的行被插入或更新时,它都会自动更新。
timestamp 中的值不是作为实际的日期或时间存储的,而是以 binary(8) 或 varbinary(8) 存储的,它表示表中行的事件序列。一个表只能有一个 timestamp 列。
有关具体信息,请参见 SQL Server Books Online。
Microsoft SQL Server 对象的权限可以授予给其它数据库用户、数据库组和 public 角色,也可以被其拒绝或撤销。与 Oracle 不同,SQL Server 不答应对象所有者给对象授予 ALTER TABLE 和 CREATE INDEX 权限。这些权限必须只属于对象所有者。
GRANT 语句在安全系统中创建一个条目,答应当前数据库中的用户处理当前数据库中的数据或执行特定的 Transact-SQL 语句。在 Oracle 和 SQL Server 中,GRANT 语句的语法是相同的。
DENY 语句在安全系统中创建一个条目,拒绝当前数据库中安全帐户的权限,并禁止安全帐户以组或角色成员身份继续权限。Oracle 没有 DENY 语句。REVOKE 语句撤销以前授予当前数据库中一个用户的权限或被其拒绝的权限。
有关对象级权限的具体信息,请参见 SQL Server Books Online。
在 Oracle 中,REFERENCES 权限只能授予一个用户。SQL Server 则答应将 REFERENCES 权限授予数据库用户和数据库组。在 Oracle 和 SQL Server 中,INSERT、UPDATE、DELETE 和 SELECT 权限授予的方式相同。
实施数据完整性和业务规则
实施数据完整性确保了数据库中数据的质量。在表的规划中,有两个重要的步骤,即识别列的有效值,以及确定如何在列中实施数据完整性。数据完整性可以分为四个类别,并用不同的方法来实施。
实体完整性把一行定义为特定表的一个单独实体。实体完整性通过索引、UNIQUE 约束、PRIMARY KEY 约束或 IDENTITY 属性,来实施表的标识符列或主键的完整性。
约束的命名
应该始终显式命名约束。假如没有,则 Oracle 和 Microsoft SQL Server 使用不同的命名规则隐式命名约束。这些命名上的差别会给迁移过程带来不必要的麻烦。在删除或禁用约束时,就会造成不一致,因为必须使用名称,约束才能被删除。对于 Oracle 和 SQL Server 来说,显式命名约束的语法是相同的。
CONSTRAINT constraint_name
主键和唯一列
SQL-92 标准要求,主键中的所有值应该唯一,并且该列不答应有空值。
一旦定义了 PRIMARY KEY 或 UNIQUE 约束,Oracle