购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.3 常用的关系运算

数据查询是实际应用中最常用的操作。关系代数是一种抽象的查询语言,是以集合代数为基础、以关系(表)为运算对象的高级运算。 关系运算具有三大要素: 运算对象、运算符和运算结果。关系代数的运算对象和运算结果都是关系。

2.3.1 关系运算种类和运算符

1.关系运算的种类

关系运算的种类 两种 :传统关系运算和专门关系运算。 传统关系运算 将关系作为集合,并对“水平”方向(行)运算, 专门关系运算涉及 行和列。

(1)传统关系运算

传统关系运算主要使用传统的集合运算方法将关系(表)作为行(记录)的集合,从关系的行方向进行(集合)运算,常用的是两个关系的运算。

传统的集合运算可以实现的基本操作 如下。

1)并运算。在数据库中,用于实现对指定数据的插入和添加操作。

2)差运算。在数据库中,用于实现对指定数据记录的删除操作。

3)差并结合。修改数据的操作,要先删除(差)后插入(并)。

(2)专门关系运算

专门关系运算 是针对关系数据库专门设计的,涉及关系的行和列。利用比较运算符和逻辑运算符可以实现辅助专门的关系运算符操作。有时还需要对关系本身运算,如果需要显示表中某列的值,就需要利用关系的专门运算中的“投影”。

2.关系运算符

关系运算符有四种 :集合运算符、专门的关系运算符、(算术)比较运算符和逻辑运算符。具体的使用方法将在后面结合应用案例介绍。

1)集合运算符:∪(并运算)、—(差运算)、∩(交运算)、×(笛卡儿积)。

2)专门的关系运算符:σ(选择)、π(投影)、 (连接)、÷(除)。

3)(算术)比较运算符:>(大于)、≥(大于或等于)、<、≤、=、≠。

4)逻辑运算符: (非)、∧(与)、∨(并)。

2.3.2 传统的关系运算

传统的关系运算可以归纳为集合运算,即对两个关系的集合运算, 主要包括四种 :并、差、交和广义笛卡儿积。

1.并运算

设关系 R 和关系 S 具有相同的 n 目(属性/列),且相应的属性取自同一个域,则 关系 R 和关系 S 的并(Union) 由属于 R 或属于 S 的记录(元组)组成。其结果关系的目仍为 n ,记为 R S 形式化定义 R S ={ t|t R t S }。其中, t 表示关系 R S 中的记录,即关系 R S 中的行。

注意: R S 的结果集合是 R 中的记录和 S 中的记录合并一起构成的一个新关系。特别要指出的是,合并后的结果必须除去重复记录。

【案例2-10】 已知关系 R 和关系 S ,如表2-3和表2-4所示,计算出关系 R 和关系 S 的并 R S ,其计算结果如表2-5所示。

表2-3 关系 R

表2-4 关系 S

表2-5 R S 结果

2.差运算

设关系 R 和关系 S 具有相同的 n 目(列/属性),且相应的属性取自同一个域,则 关系 R 和关系 S 的差(Difference) 由属于 R 且不属于 S 的记录组成。其结果关系的目仍为 n ,记为 R-S 。形式化定义为 R-S ={ t|t R t S }。其中, t 表示属于 R 且不属于(差掉) S 的所有记录。

【案例2-11】 已知关系 R 和关系 S ,如表2-3和表2-4所示,求关系 R S 的差 R-S ,其计算结果如表2-6所示。

表2-6 关系 R-S

3.交运算

设关系 R 和关系 S 具有相同的 n 目(列/属性),且相应的属性取自同一个域,则 关系 R 和关系 S 的交(Intersection) 由属于 R 且属于 S 的记录组成。其结果关系的属性数仍为 n ,记为 R S 形式化定义 R S ={ t|t R t S }。其中, t 为同时属于关系 R S 中的所有记录,即关系 R S 中行的公共部分。

【案例2-12】 已知关系 R 和关系 S ,如表2-3和表2-4所示,计算关系 R S 的交 R S ,其计算结果如表2-7所示。

表2-7 关系 R S

知识拓展

关系 R 和关系 S 的交集

4.广义笛卡儿积

设关系 R 和关系 S 的目(列/属性)分别为 r s 。关系 R S 广义笛卡儿积(Extended Cartesian) R × S 是一个( r + s )目的记录集合(新关系有 r + s 列),每个记录的前 r 个分量(属性值)来自关系 R 的一个记录,后 s 个分量是关系 S 的一个记录。关系 R 和关系 S 的笛卡儿积记为 R × S ,其 形式化定义

说明: t r t s 中的 r s 为上标,分别表示 r 个分量和 s 个分量。若关系 R 的基数(行数)为 k 1 ,关系 S 的基数为 k 2 ,则关系 R 和关系 S 的笛卡儿积的基数为 k 1 × k 2

【案例2-13】 已知关系 R 和关系 S ,如表2-3和表2-8所示,求关系 R S 的广义笛卡儿积 R × S ,具体的结果如表2-9所示。

表2-8 关系 S

表2-9 关系 R × S

注意: 关系 R 和关系 S 中有相同的属性名“学号”,在计算结果中为了区分,需要在其属性名前标注上相应的关系名,如 R .学号和 S .学号。

在实际应用中,单独笛卡儿积本身并无具体实际意义和用途,只有在两表连接时需要限制条件,才能起到正确处理有效数据的作用。

2.3.3 专门的关系运算

专门的关系运算有四种 :选择运算、投影运算、连接运算和除运算。其中,选择运算可以在多表中选取符合满足条件的记录并构成新关系(表),投影运算可选取记录中指定的属性(列)并构成新关系,连接运算可选取符合条件的记录串联(连接)成新关系,除运算可选取象集符合条件的记录的多个属性(列)构成新关系。

1.选择运算

选择(Selection) 运算也称 限制(Restriction) ,可对关系进行水平(行)分割(选取)。选择是在表中选取符合指定条件的记录, 记为 σ F R 。其中, σ 为选择运算符; F 表示选择条件, F 通常是一个逻辑表达式,其取值为逻辑值“真”(成立)或“假”(不成立)。 σ F R )表示从 R 中选取满足条件 F 的记录(行)所构成的新关系, 形式化定义 σ F R )={ t|t R F t )=true}。

逻辑表达式 F 的基本形式 X θ Y 。其中,θ表示比较运算,可以是>、≥、<、≤、=、≠; X Y 为属性名、常量或简单函数,属性名可以用其序号替代。在基本的选择条件中可以进一步地进行逻辑运算,包括非( )、与(∧)、或(∨)运算。

【案例2-14】 在商品数据表(如表2-10所示)中,查询出所有产地为“深圳”的商品信息。在“商品”数据表中进行选择运算 σ 产地 ='深圳'或 σ 8 ='深圳',其结果如表2-11所示。

表2-10 商品数据表

表2-11 产地为“深圳”的选择结果

【案例2-15】 查询商品价格低于500元的商品信息。在“商品”数据表中进行选择运算 σ 价格 <500或 σ 3 <500,其结果如表2-12所示。

表2-12 价格低于500元的选择运算结果

知识拓展

投影结果中对重复记录操作

2.投影运算

投影(Projection) 运算可对关系(表)进行垂直分割,即对关系的列方向的筛选。

投影运算是在一个关系中选取某些属性或列,并重新排列其顺序,再删掉重复记录后构成的新关系,是对二维表的垂直分割, 记为π A R 。其中,π为投影运算符, A 为关系 R 中的属性列。 投影运算的形式化定义 (π A R )={ t A t )∈ R }

【案例2-16】 已知商品数据表,如表2-10所示,查询商品的产地信息。

投影运算π 产地 (商品信息表)或π 8 (商品信息表)的结果如表2-13所示。

表2-13 投影“产地”运算结果

【案例2-17】 已知商品数据表,如表2-10所示,查询商品的名称和价格信息。

投影π 商品名称,价格 (商品信息表)或π 2.3 (商品信息表)的结果如表2-14所示。

表2-14 投影“商品名称”和“价格”运算结果

3.连接运算

连接(Join) 运算也称为 θ连接 ,是从两个关系的广义笛卡儿积中选取属性间满足一定条件的记录。 形式化定义为

其中, A B 分别为关系 R 和关系 S 上列数相同且可比的属性组。θ为比较运算符。连接运算从 R S 的笛卡儿积 R × S 中选取 R 关系在 A 属性组上的值与 S 关系在 B 属性组上的值满足比较关系θ的记录。

连接运算中有两种常用的连接 :等值连接(Equijoin)和自然连接(Natural Join)。

1) 等值连接 。等值连接指θ为“=”的连接运算。从关系 R 和关系 S 的广义笛卡儿积中选取 A B 属性(列)相等的记录,即等值连接记为:

2) 自然连接 。自然连接是一种特殊的等值连接,要求两个关系中进行比较的分量(属性值/数据项)必须是相同的属性组,并且在结果中把重复的属性列去掉。如果关系 R S 具有相同的属性组 B ,则自然连接可记为:

注意: 通常,连接操作是从行的角度进行运算的。而自然连接还需要取消重复列(常为后面的列),所以是同时从行和列的角度进行的运算。

【案例2-18】 设有两个关系 R 和关系 S ,分别如表2-15和表2-16所示,求 R S ,结果如表2-17~表2-19所示。

表2-15 关系 R

表2-16 关系 S

表2-17 S

表2-18 S

表2-19 R S

自然连接与等值连接的主要区别 如下。

1)等值连接中相等的属性可以是相同的属性,也可以是不同的属性,而自然连接中相等的属性必须是相同的属性。

2)自然连接结果必须去除重复属性,而等值连接的结果不需要去除重复属性。

3)自然连接用于有公共属性的情况。若两个关系没有公共属性,则它们不能进行自然连接,而等值连接无此要求。自然连接在多表数据调用时常用。

4.除运算

给定关系 R X Y )和 S Y Z ),其中 X Y Z 为属性组。 R 中的 Y S 中的 Y 可以有不同的属性名,但必须出自相同的域集。

R S 除运算(Division) 得到一个新的关系 P X ), P R 中满足下列条件的记录在 X 属性列上的投影:记录在 X 上的分量值 x 的象集 Y X 包含 S Y 上投影的集合。 记作:

其中, Y X x R 中的象集, x = t r [ X ]。除运算通常是对关系的行和列角度进行操作。

除运算的计算过程 如下。

1)将被除关系的属性分为象集属性和结果属性两部分,与除关系相同的属性归于象集,不相同的属性归于结果集。

2)在除关系中,在与被除关系相同的属性(象集属性)上投影,得到除目标数据集。

3)将被除关系分组,将结果属性值相同的记录分为一组。

4)观察每个组,若它的象集属性值中包括除目标数据集,则对应的结果属性值应该属于除法运算结果集,并去掉与原被除关系相同的分组。

【案例2-19】 (源自:数据库系统工程师2005年5月试题44),已知关系 R (表2-20)和关系 S (表2-21),求 R ÷ S ,如表2-22所示。

表2-20 关系 R

表2-21 关系 S

表2-22 R ÷ S

具体除运算的计算过程

1)关系 R 中属性组( A B )的取值为{(2,1),(2,2),(3,2)}。其中,(2,1)的象集为{(a,c),(b,d)},(2,2)的象集为{(a,d)},(3,2)的象集为{(b,d),(b,c)}。

2)关系 S 在属性组( C D )上的投影为{(a,c),(b,d)}。

3)找出全部属性组( A B )象集包含关系 S 属性组( C D )上的投影的取值,即为新关系 R ÷ S ,此处通过比较1)和2)可以发现,只有记录(2,1)的象集包含关系 S 在属性组( C D )上的投影,所以 R ÷ S 只有一个记录(2,1),即 R ÷ S 运算结果如表2-22所示。

除的基本运算可以表示为等价关系表达式:

π A R A π A R )× S-R

下面举例说明关系代数 综合运算应用

知识拓展

除法运算的实际应用

设商品销售数据库有三个关系:商品、售货员和售货。

商品(商品编号,商品名,产地,价格,等级)

售货员(售货号编号,姓名,性别,年龄)

售货(商品编号,售货员编号,数量)

【案例2-20】 查询所有产地为北京的商品信息:

σ 产地='北京' (商品)

查询年龄在35岁以下男性的售货员编号和姓名:

π 售货员编号,姓名 σ 年龄<35∧性别='男' (售货员))

查询售出商品编号为K006的售货员姓名:

π 姓名 σ 商品编号='K006' (售货▷◁售货员))

讨论思考:

1)交、并、差运算的两个关系必须满足什么条件?

2)除运算的结果主要表示什么具体的含义?

3)等值连接和自然连接之间的区别是什么? 2DoXCCazoTpgqbjtdGPg6buYc9TXISWW0wslz+1TPLOx8bNUANv+pXZoh9HLbq1m

点击中间区域
呼出菜单
上一章
目录
下一章
×