关系数据库
一, 关系数据库的由来
1, 系统而严格的提出关系数据库模型的是美国IBM的E.F.Codd
2, 1970年,E.F.Codd继续完善和发展关系理论。
3, C.J.Data是关系数据库领域中最著名的独立撰稿人,学者和顾问。
二, 关系模型概述
关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。
1、单一的数据结构关系
关系模型中的数据结构非常单一。实体及实体间的联系都用关系表示,关系就是一张二维表。
2、关系操作
关系模型中常用的关系操作包括。关系操作的特点是集合操作方式,即操作的对象和结果都是集合。这种操作方式也成为一次一集合的方式。相应地,非关系数据模型的数据操作方式则为一次一记录的方式。
3、关系的三类完整性约束:实体完整性,参照完整性,用户定义完整性。
三, 关系数据结构及形式化定义
1, 关系
1.域:域是一组具有相同数据类型的值的集合。
2.笛卡儿积:
定义:给定一组域D1,D2,…,Dn,这些域中可以有相同的。D1,D2,…,Dn的笛卡儿积为:
D1×D2×…×Dn={(d1,d2, …,dn) | di∈Di,i=1,2, …,n}
其中每一个元素(d1,d2, …,dn)叫做一个n元组或简称元组(Tuple)。元组中的每一个值di叫做一个分量(Component)。
若Di(i=1,2, …,n)为有限集,其基数为mi(i=1,2, …,n),则D1×D2×…×Dn的基数M为:mi的积。
3.关系:
定义:D1×D2×…×Dn的子集叫做在域D1,D2,…,Dn上的关系,表示为:
R(D1,D2,…,Dn)
D1×D2×…×Dn表示的是域上所有可能的组合,在现实生活中很多元组是无意义的数据,而一个关系肯定包含在D1×D2×…×Dn之中,因此在数学上把关系定义为D1×D2×…×Dn的子集。
关系是笛卡儿积的有限子集,所以关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。由于域可以相同,为了加以区分,必须对每列起一个名字,称为属性。N目关系必有n个属性。
候选码:若关系中的某一属性组的值能唯一地标识一个元组,则称该数据组为候选码。
全码:若一个关系有多个候选码,则选定其中一个为主码。主码的诸属性称为主属性。不包含在任何候选码中的属性称为非码属性。关系模式的所有数据组是这个关系模式的候选码,称为全码。
关系可以有三种类型:基本关系、查询表和视图表。
对关系的限定和扩充:
⑴ 无限关系在数据库系统中时无意义的。因此,限定关系数据模型中的关系必须是有限集合。
⑵ 通过为关系的每个列附加一个属性名的方法取消关系元组的有序性。
基本关系具有以下六条性质:
1,列是同质的,即每一列中的分量是同一类型的数据,来自同一个域。
2,不同的列可以出自同一个域,称其中的每一列为一个属性,不同的属性要给予不同的属性名。
3,列的顺序无所谓,即列的次序可以任意交换。
4,任意两个元组不能完全相同。
5,行的顺序无所谓,即行的次序可以任意交换。
6,分量必须取原子值,即每一个分量都必须是不可分的数据项。
备注:在许多实际关系数据库产品中,基本表并不完全具有这六条性质,例如,有的数据库产品能(如FoxPro)仍然区分了属性顺序和元组的顺序;许多关系数据库产品中,例如Oracle,FoxPro等,它们都允许关系表中存在两个完全相同的元组。
四,关系模式
定义:关系的描述称为关系模式。它可以形式化地表示为:
R(U,D,dom,F)
关系模式通常可以简记为:
R(U)或R(A1,A2, …,AN)
五,关系的完整性
1、实体完整性
实体完整性规则:若属性A是基本关系R的主属性,则属性A不能取空值。
实体完整性规则说明如下:
⑴ 实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集。
⑵ 现实世界中的实体是可区分的,即它们具有某种唯一性标识。
⑶ 相应地,关系模型中以主码作为唯一标识。
⑷ 主码中的属性即主属性不能取空值。所谓空值就是“不知道”或“不确定”的值。
2、参照完整性
外码定义:设F是基本关系R的一个或一组属性,但不是关系R的码,如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码(Foreign Key),并称基本关系R为参照关系,基本关系S为被参照关系或目标关系。关系R和S不一定是不同的关系。
注意:F不能是关系R的主码,Ks必须是关系S的主码。
参照完整性规则就是定义外码与主码之间的引用规则:
参照完整性规则:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:
或者取空值(F的每个属性值均为空值);
或者等于S中某个元组的主码值。
3、用户定义的完整性:即是针对某一具体关系数据库的约束条件。
未完待续。
小康
2004-2-29