【案例1-1】 数据库技术及应用极为重要且广泛深入 。美国未来学家托尔勒曾指出:“谁掌握了信息,谁控制了网络,谁就将拥有整个世界”。现实世界, 信息无处不在、数据无处不用 ,数据库技术是各种业务数据处理与应用系统的 核心及关键 。数据库建设规模、数据量和使用频度已成为衡量一个国家信息化程度的 重要标志 ,世界各国 极为重视 并将数据资源和高新技 术纳入优先发展战略 。
微课视频
课程视频1.1
数据(Data) 是客观事物具体特征描述的符号记录,是信息的表达方式和载体,是利用信息技术进行采集、处理、存储和传输的基本对象。通常, 数据分为两大类 ,即数值数据和非数值数据,包括文字、数字、符号、表格、图形、图像、声音、视频等多种形式。数据也可从应用上细分为数值型、字符型、时间型、货币型或其他类型。
知识拓展
信息的概念及主要内涵
特别理解
数据概念的内涵及解析
数据包含两个方面:描述(表示)具体事物特征的内容、存储在某种媒体上的数据形式和含义。其中,数据的含义称为 数据的语 义(信息),数据与其语义合为一体,不可分离。在实际业务处理过程中,各种信息只有经过数据载体的描述和表示,才能进行采集、传输、存储、管理与处理,并产生新的更有价值的数据(信息),如网站通过数据提供信息。
信息与数据有以下区别和联系 。信息是客观事物在人脑中的反映,是概念性的,需要通过数据才能表示、存储、传输和处理。可按人为需要选取信息的数据表示形式及方式方法,如文字、图像、语音等。数据的表示形式可以选择,而信息不会随着数据的表示形式而改变,如气象信息(以数据展现)。数据是信息的载体和具体表达方式,是信息的一种符号化表示,是物理性(客观存在)的。数据是信息的来源,并提供信息(含义),数据经过处理后可得到更有价值的新数据(信息)。
数据处理(Data Processing) 广义上是对各种数据进行采集、存储、检索、加工、变换和传输的过程,狭义上主要是指对数据进行加工的过程,如对多种商品数据进行查询、分类、修改、运算、统计、汇总等。其 目的 是根据实际需要,从原有的众多、繁杂、难以理解的数据中抽取出有价值的新数据(信息),作为决策的依据,其实质是信息处理。可以利用数据库技术处理和存取各种业务数据,快捷方便地充分利用各种数据(信息)资源,代替人的脑力劳动,极大地提高工作效率,并减少费用。各行业业务数据处理技术发展及应用的广度和深度,极大地促进了人类信息化的进程。
不同的数据处理方式要求不同的软硬件技术支持。每种处理方式都有其特点,可以根据实际应用问题的具体需求选择合适的处理方式。 数据处理方式主要有四种: ①以数据处理设备的结构分为联机处理方式和脱机处理方式;②以数据处理时间的分配方式分为批处理方式、分时处理方式和实时处理方式;③以数据处理空间的分布方式分为集中式处理方式和分布处理方式;④以中央处理器的工作方式分为单道作业处理方式、多道作业处理方式和交互式处理方式。
数据管理(Data Management) 是指以管理方式对数据进行基本加工的过程。如在数据处理过程中,数据采集、存储、检索、分类、传输等基本环节统称为数据管理。广义上,数据管理也属于数据处理。
知识拓展
数据处理与数据管理的区别
【案例1-2】 Web图书销售信息系统的商品数据管理。 在Web图书销售信息系统的“价格”中,分类检索图书数据或查询价格最高的图书、按价格排序、修改或打印订货单等都属于数据管理,而对图书名称、价格、出版社等进行汇总或制作图书数据统计表等则属于数据处理。
数据库(DataBase,DB) 是按照指定数据结构进行组织、存取和处理数据的集合,是存储在计算机或服务器等设备上的结构化(有组织)、可共享的相关数据集合。可将其概念理解为“按一定(模式)结构存取、控制与处理数据的空间(库)”。
数据库可按特定数据模型(结构)进行组织、表示、控制与处理数据。数据库具有数据结构化、共享性、独立性、持久性、较小冗余度、易扩展和海量性等 基本特性 , 操作处理的基本对象是数据 。
数据库系统(DataBase System,DBS) 是指具有数据处理功能特点的系统,是可以实现有组织及动态地存储、管理和维护大量相关数据,提供数据处理和数据资源共享服务功能的 数据库应用系统 。常用的网购、网银等业务数据处理系统都是数据库系统。
数据库技术是对数据库及数据进行研究、处理和应用的一门软件科学,也是计算机科学与技术中发展最快、应用最广泛和热门的技术之一。其研究和处理的关键是数据。
数据库管理系统(DataBase Management System,DBMS) 是指建立、运用、管理和维护数据库,并对数据进行统一管理和控制的系统软件,主要用于定义(建立)、操作、管理、控制数据库和数据,并保证其安全性、完整性、多用户并发控制及出现意外时进行恢复等。DBMS 是整个数据库系统的核心 ,可对数据库中的各种业务数据进行统一管理、控制和共享。DBMS的重要地位和作用如图1-1所示。
图1-1 DBMS的重要地位和作用
常见的大型DBMS有SQL Server、Oracle、MySQL、Sybase、DB2、Informix等,小型的有VFP(Visual FoxPro)和Office Access等。
知识拓展
数据库系统的主要特点
1)对数据统一管理与控制,采取统一的标准。各种应用(程序)对于数据库中数据的各种操作都由DBMS进行统一管理和控制。DBMS提供的主要功能包括并发访问控制、数据完整性、数据安全性保护、数据库恢复。采取统一的 数据标准 ,即数据库中数据项的名称、数据类型、数据格式、有效数据的判定准则和要求等数据项特征值的取值规则。
2)数据整体结构化。在数据库系统中,采用统一的数据模型(结构),将整个企事业机构的业务数据组织为一个整体;数据不再只面向特定应用,而是面向整个机构;数据内部及整体结构化,可以更好地反映各实体(事物)间的联系。实现多种关联数据的集中处理和高度集成,有助于实现数据共享,保证数据和应用程序的各自独立性。
3)数据高共享、低冗余、易扩充。数据库系统可以通过网络对数据集中管理控制,并由多用户和多种应用程序所共享与调用。相同的数据不会多次重复出现,从而降低了数据冗余度,并可避免数据冲突。当业务数据发生变化更新时,只需要修改服务器中的数据表便可自动完成所有的更新。
4)数据独立性高且程序维护便利。 数据独立性 是指数据库中的存储数据与应用处理程序之间相互独立,可极大提高应用程序和数据的修改及维护效率,可由DBMS二级映像功能实现。 数据独立性包括以下两种。 ① 物理独立性 是指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。数据在磁盘上的存储由DBMS管理,应用程序要处理的只是数据的逻辑结构。② 逻辑独立性 是指用户的应用程序与数据库的逻辑结构是相互独立的,当数据的逻辑结构(数据元素间的逻辑关系)改变时,用户程序不受任何影响。
知识拓展
数据的物理及逻辑结构
5)数据的完整性及安全性高。 数据完整性(Data Integrity) 是指数据的正确性、有效性和相容性。 正确性 是指数据合法规范, 有效性 是指数据规定的有效范围, 相容性 是指描述同一事物的各数据保持一致性。数据库的完整性关系到数据库系统中的数据是否正确、可信和一致。
知识拓展
数据完整性的4种类型
数据完整性有4种:实体完整性、参照完整性、域完整性和用户自定义完整性。通过数据库管理系统(DBMS)的管理和控制可确保安全性。
6)保证数据一致性。 数据一致性(Data Consistency) 是指关联数据之间逻辑关系的正确性和同一性。确保数据库中不同数据表的相同数据项具有相同值。各数据库由多种数据文件组成,其文件之间通过公共数据项相联系,当对某个数据文件中的数据项进行更新时,相关联文件中的对应数据项将自动更新,始终保持数据增删改等操作的一致性和正确性。
数据库技术研究和处理的基本对象 是数据,涉及的 主要内容 包括四个方面。
1)通过DBMS对数据库系统及业务数据相关事务进行统一管理、控制和维护。
2)按照指定的数据结构(模型)建立和组织相应数据库及处理对象(数据表、视图、索引等)。
3)进行各种业务数据处理,如数据添加(输入/插入)、修改与更新、删除、查询、统计、报表和打印等。
4)对业务数据处理的需求及构建数据库应用系统的需求分析,设计并实现数据处理和综合应用的数据库应用软件。
下面介绍 数据库技术的主要应用 。根据用户需求自动处理、共享、管理和控制大量业务数据。21世纪是现代信息化社会,信息(数据)无处不在、无处不用,数据库技术的应用更广泛、更快捷、更深入,遍布各个应用领域、行业、业务部门和各个层面。网络数据库系统已成为信息化建设和应用中的核心及重要支柱产业,纳入世界各国优先发展战略。鉴于篇幅所限,此处只概述几例典型应用。
知识拓展
数据库技术的促进作用
【案例1-3】 数据库技术典型实际应用案例。
①电子商务。网上购物,或机票、火车票的查询、订购、销售、统计、数据输入和汇总等。
②网上办公。通过政府或机构网站进行网上政策发布、办公、查询、数据输入、传输和反馈等。
③网银证券。网上银行客户信息、账户、汇款、理财、贷款和支付等,以及证券及期货交易、股票、债券、金融票据、基金及外汇交易、保险产品等的数据处理。
④电信通信。各种网络通信与服务、电子邮件与文件传输、数据交换、各种电信业务服务,存储通信网络信息、通话记录及短信、用户付费业务记录、通信账单和交费情况等。
⑤经贸、旅游、交通。国内外经贸交易、旅游、交通、气象等数据,都需要利用分布式数据库,通过相关数据输入、存储、查询、传输、更新、统计、汇总等提供技术支持和帮助。
⑥教育。高校教学等相关信息、课程及实验信息、图书资料信息、人力资源、设备及实验室、学生及成绩信息、大学生活动和毕业及就业信息等。高校信息化数据库应用实例如图1-2所示。
图1-2 高校信息化数据库应用实例
1946年,世界上第一台电子计算机ENIAC诞生,主要用于科学计算。ENIAC以电子管为元器件,具有运算器、控制器、存储器和简单输入/输出设备,没有磁盘等直接存储设备,也没有操作系统和数据文件处理软件,体积大且运行慢,只能计算并输入/输出很少的数据。数据存储当时面临的一个重要问题是将数据和程序以打孔方式存储在纸带上,很难检索或修改。数据管理主要依靠手工方式,用纸卡及表格等进行记载、存储、查询和修改。
知识拓展
数据管理的产生背景
人工数据管理阶段 的 主要特点 如下。
1)数据无法存取。由于计算机软硬件技术所限,数据随程序一起输入计算机,处理结束后输出结果,无法长期保存,计算后数据空间与程序一起被释放。
2)数据面向应用。数据对应指定的具体应用程序,多个程序使用相同的数据时,需在其程序中重复存储相同的数据,程序之间所用的数据不共享,造成数据冗余且可能不一致。
3)数据不独立。当应用程序改变时,数据的逻辑结构和物理结构也会随之变化。
4)无数据文件处理软件。数据的组织方式由程序员设计和安排,数据须由应用程序进行管理。
20世纪50年代中期到60年代中期,计算机以晶体管取代了电子管,存储器得到改进,数据可用文件形式存储,将成批数据单独组成文件并存储到外存,出现了可管理文件的操作系统、汇编语言和一些高级语言。计算机不仅限于科学计算,还大量用于各种业务管理等。
(1)文件系统管理数据的特点
1)数据持久保存。各种数据主要以文件形式保存在计算机中,如同电子表格数据。
2)数据无法共享。在文件系统中,文件面向应用,当不同的文件具有相同的数据时,需要建立各自的文件,无法共享,致使数据冗余,浪费存储空间。
3)数据不能独立。软件同数据关联时只部分独立,改变应用程序要改变数据结构,反之数据结构改变,需要修改应用程序和文件结构。
4)数据管理功能简单。用文件系统管理数据的功能简单。应用和数据文件之间的关系如图1-3所示。
图1-3 应用和数据文件间的关系
(2)文件系统的缺点
知识拓展
数据库文件系统的缺陷
由于各种业务数据的规模和数据量急剧增加,文件系统的缺点逐渐突显,主要包括数据不共享、冗余大,数据不一致,数据文件缺乏关联。
20世纪60年代中期,随着信息技术的快速发展和广泛应用,对存储和处理庞大数据量的数据库给予了极大的技术支持。操作系统得到很大改进,推出了各种DBMS软件,数据库技术不断发展和完善,成为计算机领域中最具影响力和发展潜力、应用范围最广、成果最显著的技术之一,形成了“数据库时代”。
知识拓展
关系数据库的产生过程
初期数据库阶段的 主要特点 如下。
1)数据共享,冗余少。数据面向整个系统,数据被多用户、多应用共享。数据库与网络技术结合并扩展应用,数据冗余少,节省空间。
2)对数据统一管理控制。可验证用户身份及操作合法性、数据一致性和相容性,保证数据符合完整性约束条件、数据安全性和完整性,并发控制多用户操作,意外时自动恢复。
3)独立性强。应用程序与数据库中的数据相互独立,当数据的物理结构和逻辑结构更新变化时,不影响应用程序使用数据;反之,修改应用程序,不影响数据。
4)结构化集成。数据库系统通过统一数据结构方式,使数据结构化;全局的数据结构由多个应用程序共同调用共享,各程序可以调用局部结构的数据,全局与局部的结构模式构成数据集成。
20世纪80年代后,数据库技术在商业上取得巨大成功,激发了很多新的应用领域和业务,特别是手机网络App等的广泛应用,极大地促进了数据库技术的快速发展,形成了高级数据库技术。
(1)分布式数据库技术
随着企事业机构跨地区业务的发展,以及IT技术发展和异地用户对数据共享的需求,产生了 分布式数据库系统(Distributed Database Systems) , 主要特点 有五个。
1)以本地为主处理大部分业务数据。在本地区分布处理当地的各种数据,提高了整个系统的处理效率和可靠性,并通过数据复制技术实现网络数据共享。
2)减少中心数据库和数据传输压力。数据库中的数据物理上分布于各地,逻辑上为相互联系的整体,可实现数据物理分布性和逻辑整体性,减少中心数据存储和传输负载。
3)提高系统的可靠性。系统的可靠性得到增强,若局部系统发生意外故障,其他部分仍可继续工作。
4)各地终端数据通过网络互联。对于本地终端不能单独处理的各种业务数据,可以通过外部网络得到其他数据库系统和终端的大力支持。
5)数据库分布扩展便捷。数据库集中于分布式数据库系统,便于实现分布及扩充。
分布式数据库系统的两大任务 是集中管理和分布处理,其具体结构如图1-4所示。
图1-4 分布式数据库系统的具体结构
(2)面向应用领域的专用数据库
数据库技术经过几十年的研究和快速发展,形成了完善的理论体系和实用技术。为了更好地适应多种业务数据处理的需求,根据各应用领域特点,将数据库技术用于某些特定领域,研发出专用的科学数据库、工程数据库、地理数据库、统计数据库、空间数据库、大数据等,以及数据仓库和数据挖掘等技术。数据库技术发展简图如图1-5所示。
图1-5 数据库技术发展简图
讨论思考:
1)什么是数据、数据处理和数据库?
2)数据库系统与数据库管理系统的区别有哪些?
3)数据库技术的主要特点有哪些?其常见应用有哪些?
4)数据库系统的发展分为哪几个阶段?有何特点?
微课视频
课程视频1.2