数据查询是实际应用中最常用的操作。关系代数是一种抽象的查询语言,是以集合代数为基础、以关系(表)为运算对象的高级运算。 关系运算具有三大要素: 运算对象、运算符和运算结果。关系代数的运算对象和运算结果都是关系。
关系运算的种类 有 两种 :传统关系运算和专门关系运算。 传统关系运算 将关系作为集合,并对“水平”方向(行)运算, 专门关系运算涉及 行和列。
(1)传统关系运算
传统关系运算主要使用传统的集合运算方法将关系(表)作为行(记录)的集合,从关系的行方向进行(集合)运算,常用的是两个关系的运算。
传统的集合运算可以实现的基本操作 如下。
1)并运算。在数据库中,用于实现对指定数据的插入和添加操作。
2)差运算。在数据库中,用于实现对指定数据记录的删除操作。
3)差并结合。修改数据的操作,要先删除(差)后插入(并)。
(2)专门关系运算
专门关系运算 是针对关系数据库专门设计的,涉及关系的行和列。利用比较运算符和逻辑运算符可以实现辅助专门的关系运算符操作。有时还需要对关系本身运算,如果需要显示表中某列的值,就需要利用关系的专门运算中的“投影”。
关系运算符有四种 :集合运算符、专门的关系运算符、(算术)比较运算符和逻辑运算符。具体的使用方法将在后面结合应用案例介绍。
1)集合运算符:∪(并运算)、—(差运算)、∩(交运算)、×(笛卡儿积)。
2)专门的关系运算符:σ(选择)、π(投影)、 (连接)、÷(除)。
3)(算术)比较运算符:>(大于)、≥(大于或等于)、<、≤、=、≠。
4)逻辑运算符: (非)、∧(与)、∨(并)。
传统的关系运算可以归纳为集合运算,即对两个关系的集合运算, 主要包括四种 :并、差、交和广义笛卡儿积。
设关系 R 和关系 S 具有相同的 n 目(属性/列),且相应的属性取自同一个域,则 关系 R 和关系 S 的并(Union) 由属于 R 或属于 S 的记录(元组)组成。其结果关系的目仍为 n ,记为 R ∪ S 。 形式化定义 为 R ∪ S ={ t|t ∈ R ∨ t ∈ S }。其中, t 表示关系 R 或 S 中的记录,即关系 R 或 S 中的行。
注意: R ∪ S 的结果集合是 R 中的记录和 S 中的记录合并一起构成的一个新关系。特别要指出的是,合并后的结果必须除去重复记录。
【案例2-10】 已知关系 R 和关系 S ,如表2-3和表2-4所示,计算出关系 R 和关系 S 的并 R ∪ S ,其计算结果如表2-5所示。
表2-3 关系 R
表2-4 关系 S
表2-5 R ∪ S 结果
设关系 R 和关系 S 具有相同的 n 目(列/属性),且相应的属性取自同一个域,则 关系 R 和关系 S 的差(Difference) 由属于 R 且不属于 S 的记录组成。其结果关系的目仍为 n ,记为 R-S 。形式化定义为 R-S ={ t|t ∈ R ∧ t ∉ S }。其中, t 表示属于 R 且不属于(差掉) S 的所有记录。
【案例2-11】 已知关系 R 和关系 S ,如表2-3和表2-4所示,求关系 R 和 S 的差 R-S ,其计算结果如表2-6所示。
表2-6 关系 R-S
设关系 R 和关系 S 具有相同的 n 目(列/属性),且相应的属性取自同一个域,则 关系 R 和关系 S 的交(Intersection) 由属于 R 且属于 S 的记录组成。其结果关系的属性数仍为 n ,记为 R ∩ S 。 形式化定义 为 R ∩ S ={ t|t ∈ R ∧ t ∈ S }。其中, t 为同时属于关系 R 和 S 中的所有记录,即关系 R 且 S 中行的公共部分。
【案例2-12】 已知关系 R 和关系 S ,如表2-3和表2-4所示,计算关系 R 和 S 的交 R ∩ S ,其计算结果如表2-7所示。
表2-7 关系 R ∩ S
知识拓展
关系 R 和关系 S 的交集
设关系 R 和关系 S 的目(列/属性)分别为 r 及 s 。关系 R 和 S 的 广义笛卡儿积(Extended Cartesian) R × S 是一个( r + s )目的记录集合(新关系有 r + s 列),每个记录的前 r 个分量(属性值)来自关系 R 的一个记录,后 s 个分量是关系 S 的一个记录。关系 R 和关系 S 的笛卡儿积记为 R × S ,其 形式化定义 为 。
说明: t r 、 t s 中的 r 、 s 为上标,分别表示 r 个分量和 s 个分量。若关系 R 的基数(行数)为 k 1 ,关系 S 的基数为 k 2 ,则关系 R 和关系 S 的笛卡儿积的基数为 k 1 × k 2 。
【案例2-13】 已知关系 R 和关系 S ,如表2-3和表2-8所示,求关系 R 和 S 的广义笛卡儿积 R × S ,具体的结果如表2-9所示。
表2-8 关系 S
表2-9 关系 R × S
注意: 关系 R 和关系 S 中有相同的属性名“学号”,在计算结果中为了区分,需要在其属性名前标注上相应的关系名,如 R .学号和 S .学号。
在实际应用中,单独笛卡儿积本身并无具体实际意义和用途,只有在两表连接时需要限制条件,才能起到正确处理有效数据的作用。
专门的关系运算有四种 :选择运算、投影运算、连接运算和除运算。其中,选择运算可以在多表中选取符合满足条件的记录并构成新关系(表),投影运算可选取记录中指定的属性(列)并构成新关系,连接运算可选取符合条件的记录串联(连接)成新关系,除运算可选取象集符合条件的记录的多个属性(列)构成新关系。
选择(Selection) 运算也称 限制(Restriction) ,可对关系进行水平(行)分割(选取)。选择是在表中选取符合指定条件的记录, 记为 σ F ( R ) 。其中, σ 为选择运算符; F 表示选择条件, F 通常是一个逻辑表达式,其取值为逻辑值“真”(成立)或“假”(不成立)。 σ F ( R )表示从 R 中选取满足条件 F 的记录(行)所构成的新关系, 形式化定义 为 σ F ( R )={ t|t ∈ R ∧ F ( t )=true}。
逻辑表达式 F 的基本形式 为 X θ Y 。其中,θ表示比较运算,可以是>、≥、<、≤、=、≠; X 和 Y 为属性名、常量或简单函数,属性名可以用其序号替代。在基本的选择条件中可以进一步地进行逻辑运算,包括非( )、与(∧)、或(∨)运算。
【案例2-14】 在商品数据表(如表2-10所示)中,查询出所有产地为“深圳”的商品信息。在“商品”数据表中进行选择运算 σ 产地 ='深圳'或 σ 8 ='深圳',其结果如表2-11所示。
表2-10 商品数据表
表2-11 产地为“深圳”的选择结果
【案例2-15】 查询商品价格低于500元的商品信息。在“商品”数据表中进行选择运算 σ 价格 <500或 σ 3 <500,其结果如表2-12所示。
表2-12 价格低于500元的选择运算结果
知识拓展
投影结果中对重复记录操作
投影(Projection) 运算可对关系(表)进行垂直分割,即对关系的列方向的筛选。
投影运算是在一个关系中选取某些属性或列,并重新排列其顺序,再删掉重复记录后构成的新关系,是对二维表的垂直分割, 记为π A ( R ) 。其中,π为投影运算符, A 为关系 R 中的属性列。 投影运算的形式化定义 为 (π A ( R )={ t 「 A ┐ t )∈ R } 。
【案例2-16】 已知商品数据表,如表2-10所示,查询商品的产地信息。
投影运算π 产地 (商品信息表)或π 8 (商品信息表)的结果如表2-13所示。
表2-13 投影“产地”运算结果
【案例2-17】 已知商品数据表,如表2-10所示,查询商品的名称和价格信息。
投影π 商品名称,价格 (商品信息表)或π 2.3 (商品信息表)的结果如表2-14所示。
表2-14 投影“商品名称”和“价格”运算结果
连接(Join) 运算也称为 θ连接 ,是从两个关系的广义笛卡儿积中选取属性间满足一定条件的记录。 形式化定义为 :
其中, A 和 B 分别为关系 R 和关系 S 上列数相同且可比的属性组。θ为比较运算符。连接运算从 R 和 S 的笛卡儿积 R × S 中选取 R 关系在 A 属性组上的值与 S 关系在 B 属性组上的值满足比较关系θ的记录。
连接运算中有两种常用的连接 :等值连接(Equijoin)和自然连接(Natural Join)。
1) 等值连接 。等值连接指θ为“=”的连接运算。从关系 R 和关系 S 的广义笛卡儿积中选取 A 与 B 属性(列)相等的记录,即等值连接记为:
2) 自然连接 。自然连接是一种特殊的等值连接,要求两个关系中进行比较的分量(属性值/数据项)必须是相同的属性组,并且在结果中把重复的属性列去掉。如果关系 R 和 S 具有相同的属性组 B ,则自然连接可记为:
注意: 通常,连接操作是从行的角度进行运算的。而自然连接还需要取消重复列(常为后面的列),所以是同时从行和列的角度进行的运算。
【案例2-18】 设有两个关系 R 和关系 S ,分别如表2-15和表2-16所示,求 、 和 R S ,结果如表2-17~表2-19所示。
表2-15 关系 R
表2-16 关系 S
表2-17 S
表2-18 S
表2-19 R S
自然连接与等值连接的主要区别 如下。
1)等值连接中相等的属性可以是相同的属性,也可以是不同的属性,而自然连接中相等的属性必须是相同的属性。
2)自然连接结果必须去除重复属性,而等值连接的结果不需要去除重复属性。
3)自然连接用于有公共属性的情况。若两个关系没有公共属性,则它们不能进行自然连接,而等值连接无此要求。自然连接在多表数据调用时常用。
给定关系 R ( X , Y )和 S ( Y , Z ),其中 X , Y , Z 为属性组。 R 中的 Y 与 S 中的 Y 可以有不同的属性名,但必须出自相同的域集。
R 与 S 的 除运算(Division) 得到一个新的关系 P ( X ), P 是 R 中满足下列条件的记录在 X 属性列上的投影:记录在 X 上的分量值 x 的象集 Y X 包含 S 在 Y 上投影的集合。 记作:
其中, Y X 为 x 在 R 中的象集, x = t r [ X ]。除运算通常是对关系的行和列角度进行操作。
除运算的计算过程 如下。
1)将被除关系的属性分为象集属性和结果属性两部分,与除关系相同的属性归于象集,不相同的属性归于结果集。
2)在除关系中,在与被除关系相同的属性(象集属性)上投影,得到除目标数据集。
3)将被除关系分组,将结果属性值相同的记录分为一组。
4)观察每个组,若它的象集属性值中包括除目标数据集,则对应的结果属性值应该属于除法运算结果集,并去掉与原被除关系相同的分组。
【案例2-19】 (源自:数据库系统工程师2005年5月试题44),已知关系 R (表2-20)和关系 S (表2-21),求 R ÷ S ,如表2-22所示。
表2-20 关系 R
表2-21 关系 S
表2-22 R ÷ S
具体除运算的计算过程 :
1)关系 R 中属性组( A , B )的取值为{(2,1),(2,2),(3,2)}。其中,(2,1)的象集为{(a,c),(b,d)},(2,2)的象集为{(a,d)},(3,2)的象集为{(b,d),(b,c)}。
2)关系 S 在属性组( C , D )上的投影为{(a,c),(b,d)}。
3)找出全部属性组( A , B )象集包含关系 S 属性组( C , D )上的投影的取值,即为新关系 R ÷ S ,此处通过比较1)和2)可以发现,只有记录(2,1)的象集包含关系 S 在属性组( C , D )上的投影,所以 R ÷ S 只有一个记录(2,1),即 R ÷ S 运算结果如表2-22所示。
除的基本运算可以表示为等价关系表达式:
π A ( R ) -π A ( π A ( R )× S-R )
下面举例说明关系代数 综合运算应用 。
知识拓展
除法运算的实际应用
设商品销售数据库有三个关系:商品、售货员和售货。
商品(商品编号,商品名,产地,价格,等级)
售货员(售货号编号,姓名,性别,年龄)
售货(商品编号,售货员编号,数量)
【案例2-20】 查询所有产地为北京的商品信息:
σ 产地='北京' (商品)
查询年龄在35岁以下男性的售货员编号和姓名:
π 售货员编号,姓名 ( σ 年龄<35∧性别='男' (售货员))
查询售出商品编号为K006的售货员姓名:
π 姓名 ( σ 商品编号='K006' (售货▷◁售货员))
讨论思考:
1)交、并、差运算的两个关系必须满足什么条件?
2)除运算的结果主要表示什么具体的含义?
3)等值连接和自然连接之间的区别是什么?