0%

数据库系统概论

数据库系统概论

第一章 绪论

知识点分类:

①需要了解的:★★★

1
了解数据管理技术的产生和发展过程、数据库系统的优点、层次数据模型及网状数据模型的基本概念、数据库系统的组成、数据库管理员(DBA)的职责等。

②需要牢固掌握的:★★★★★

掌握:

★ 概念模型的基本概念、
★ 关系数据模型的相关概念、
★★ 数据库系统三级模式和两级映像的体系结构、
★ 数据库系统的逻辑独立性和物理独立性等。

③难点:

1
数据模型及数据库系统三级模式和两级映像的体系结构也是本章的难点。

知识点梳理:

数据库的4个基本概念

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
数据(Data)————描述事物的符号记录
地位:
数据(Data)是数据库中存储的基本对象
种类:
数字、文字、图形、图像、音频、视频、档案记录等
数据的结构:
生活中,人们可以直接用自然语言来描述事物。
计算机常常用记录来描述。
记录是计算机中表示和存储数据的一种格式和方法。

数据库(Database)————长期储存在计算机内、有组织的、可共享的大量数据的集合
数据库中的数据按一定的数据模型组织、描述和储存,冗余度小、独立性高、易扩展、可共享。

数据库管理系统(DBMS)
定义:
是基础软件,是一个大型复杂的软件系统
是位于用户与操作系统之间的一层数据管理软件
数据库管理系统的用途:
科学地组织和存储数据、高效地获取和维护数据
主要功能:
数据库的建立和维护功能
数据定义功能
数据操纵功能
数据组织、存储和管理
数据库的事务管理和运行管理
其它功能:
数据库管理系统与网络中其它软件系统的通信
数据库管理系统之间的数据转换
异构数据库之间的互访和互操作

数据库系统(Database System,简称DBS)
定义:
相关有关联关系的数据的集合。
构成:
数据库
数据库管理系统(及其应用开发工具)
应用程序
数据库管理员

image-20210326195122297

image-20210326195309398

数据管理技术的发展

image-20210326195411027

数据库系统的特点

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
数据结构化
数据的共享性高,冗余度低且易扩充
数据独立性高

物理独立性————指用户的应用程序与数据库中数据的物理存储是相互独立的。当数据的物理存储改变了,应用程序不用改变。
逻辑独立性————指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,应用程序不用改变。
数据独立性由数据库管理系统的二级映像功能来保证。

数据由DBMS统一管理和控制

数据库管理系统提供的数据控制功能
(1)数据的安全性(Security)保护
保护数据以防止不合法的使用造成的数据的泄密和破坏。
(2)数据的完整性(Integrity)检查
保证数据的正确性、有效性和相容性。
(3)并发(Concurrency)控制
对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
(4)数据库恢复(Recovery)
将数据库从错误状态恢复到某一已知的正确状态。

数据模型

数据模型是对现实世界数据特征的抽象。
通俗地讲数据模型就是现实世界的模拟

数据模型应满足三方面要求:
能比较真实地模拟现实世界
容易为人所理解

    便于在计算机上实现

数据模型是数据库系统的核心和基础

两类数据模型

(1)概念模型

    按用户的观点来对数据和信息建模,用于数据库设计。    

(2)逻辑模型 和 物理模型
逻辑模型主要包括网状模型、层次模型、关系模型、面向对象数据模型、对象关系数据模型等。

        **按计算机系统的观点对数据建模,用于DBMS实现。**

物理模型是对数据最底层的抽象。

描述数据在系统内部(磁盘)上的存储方式和存取方法。

1
2
3
客观对象的抽象过程---两步抽象
现实世界中的客观对象抽象为概念模型————将现实世界抽象为信息世界
把概念模型转换为某一数据库管理系统支持的数据模型————将信息世界转换为机器世界

★ 概念模型

用途:
概念模型用于信息世界的建模
是现实世界到机器世界的一个中间层次

    是数据库设计的有力工具  
    是数据库设计人员和用户之间进行交流的语言      

基本要求:
较强的语义表达能力
简单、清晰、易于用户理解
一种表示方法:
实体-联系方法(E-R图)

image-20210326202818034

信息世界中的基本概念
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
(1)实体(Entity) 
客观存在并可相互区别的事物称为实体。
可以是具体的人、事、物或抽象的概念。
(2)属性(Attribute)
实体所具有的某一特性称为属性。
一个实体可以由若干个属性来刻画。
(3)码(Key)
唯一标识实体的属性集称为码。
(4)实体型(Entity Type)
用实体名及其属性名集合来抽象和刻画同类实体称为实体型。
(5)实体集(Entity Set)
同一类型实体的集合称为实体集
(6)联系(Relationship)
现实世界中事物内部以及事物之间的联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。
实体内部的联系通常是指组成实体的各属性之间的联系
实体之间的联系通常是指不同实体集之间的联系
实体之间的联系有一对一、一对多和多对多等多种类型
数据模型的三个组成要素(数据结构,数据操作,完整性约束)
1
2
3
4
5
数据模型是严格定义的一组概念的集合
数据模型由三部分组成
1.数据结构--描述系统的静态特性
2.数据操作--描述系统的动态特性
3.完整性约束
常用的数据模型

image-20210326204424417

层次模型
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
	层次模型用树形结构来表示各类实体以及实体间的联系 ,是数据库系统中最早出现的数据模型。
表示方法
实体型:每个结点表示一个记录类型(实体)。
属性:每个记录类型可包含若干个字段。
联系:用结点之间的连线表示记录类型(实体)之间的一对多的父子联系。
★ 层次模型满足以下两个基本条件:
1. 有且只有一个结点没有双亲结点,这个结点称为根结点
2. 根以外的其它结点有且只有一个双亲结点
层次模型中的几个术语
根结点,双亲结点,兄弟结点,叶结点
★ 特点:
结点的双亲是唯一的
只能直接处理一对多的实体联系
任何记录值只有按其路径查看
没有一个子女记录值能够脱离双亲记录值而独立存在
优缺点:
优点:
层次模型的数据结构比较简单清晰
查询效率高,性能优于关系模型,不低于网状模型
层次数据模型提供了良好的完整性支持
缺点:
结点之间的多对多联系表示不自然
对插入和删除操作的限制多,应用程序的编写比较复杂
查询子女结点必须通过双亲结点
层次命令趋于程序化

★ 完整性约束
无相应的双亲结点值就不能插入子女结点值。
如果删除双亲结点值,则相应的子女结点值也被同时删除。

网状模型
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
	网状数据库系统采用网状模型作为数据的组织方式 。
表示方法
实体型:每个结点表示一个记录类型(实体)。
属性:每个记录类型可包含若干个字段。
联系:用结点之间的连线表示记录类型(实体)之间的一对多的父子联系。
网状模型满足以下两个基本条件:
1. 允许一个以上的结点无双亲
2. 一个结点可以有多于一个的双亲
特点
允许多个结点没有双亲结点
允许一个结点有多个双亲结点
允许两个结点之间有多种联系
要为每个联系命名并指出与该联系有关的双亲记录和子女记录
优缺点:
优点
能够更为直接地描述现实世界,如一个结点可以有多个双亲结点
具有良好的性能,存取效率较高
缺点
结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握
DDL、DML语言复杂,用户不容易使用
记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节

完整性约束

1
2
3
4
5
6
7
网状模型的完整性约束条件不严格
允许插入尚未确定双亲结点值的子女结点值
允许只删除双亲结点值
网状数据库系统(如DBTG)对数据操纵加了一些限制,提供了一定的完整性约束
码:唯一标识记录的数据项的集合
一个联系中双亲记录与子女记录之间是一对多联系
支持双亲记录和子女记录之间某些约束条件
网状模型与层次模型的区别
1
2
3
4
5
网状模型允许多个结点没有双亲结点
网状模型允许结点有多个双亲结点
网状模型允许两个结点之间有多种联系
网状模型可以更直接地描述现实世界
层次模型实际上是网状模型的一个特例

★ 关系模型

关系模型的数据结构

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
关系(Relation)
一个关系对应通常说的一张表
元组(Tuple)
表中的一行即为一个元组
属性(Attribute)
表中的一列即为一个属性,给每一个属性起一个名称即属性名
主码(Key)
也称码键。表中的某个属性组,它可以唯一确定一个元组
域(Domain)
是一组具有相同数据类型的值的集合。属性的取值范围来自某个域。
分量
元组中的一个属性值。
关系模式
对关系的描述
关系名(属性1,属性2,…,属性n)
学生(学号,姓名,年龄,性别,系名,年级)
关系必须是规范化的,满足一定的规范条件

最基本的规范条件:关系的每一个分量必须是一个不可分的数据项, 不允许表中还有表

术语对比:image-20210326205557255

关系模型的完整性约束
1
2
3
4
5
关系的完整性约束条件: 
实体完整性
参照完整性
用户定义的完整性

关系模型的优缺点
1
2
3
4
5
6
7
8
9
10
11
优点:
建立在严格的数学概念的基础上
概念单一
实体和各类联系都用关系来表示
对数据的检索结果也是关系
关系模型的存取路径对用户透明
具有更高的数据独立性,更好的安全保密性
简化了程序员的工作和数据库开发建立的工作
缺点:
存取路径对用户透明,查询效率往往不如格式化数据模型
为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度

数据库系统模式的概念

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
“型” 和“值” 的概念
型(Type)
对某一类数据的结构和属性的说明
值(Value)
是型的一个具体赋值
例如:
学生记录:
(学号,姓名,性别,系别,年龄,籍贯)
一个记录值:
(201315130,李明,男,计算机系,19,江苏南京市)
模式(Schema)
数据库逻辑结构和特征的描述
是型的描述,不涉及具体值
反映的是数据的结构及其联系
模式是相对稳定的
实例(Instance)
模式的一个具体值
反映数据库某一时刻的状态
同一个模式可以有很多实例
实例随数据库中的数据的更新而变动

数据库系统的三级模式结构

​ 模式(Schema)

1
2
3
4
5
6
7
8
9
10
11
12
模式(也称逻辑模式)
数据库中全体数据的逻辑结构和特征的描述
所有用户的公共数据视图
一个数据库只有一个模式
模式的地位:是数据库系统模式结构的中间层
与数据的物理存储细节和硬件环境无关
与具体的应用程序、开发工具及高级程序设计语言无关
模式的定义
数据的逻辑结构(数据项的名字、类型、取值范围等)
数据之间的联系
数据有关的安全性、完整性要求

外模式(External Schema)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
外模式(也称子模式或用户模式)
数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
外模式的地位:
介于模式与应用之间
模式与外模式的关系:一对多
外模式通常是模式的子集
一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
外模式与应用的关系:一对多
同一外模式也可以为某一用户的多个应用系统所使用
但一个应用程序只能使用一个外模式
外模式的用途:
保证数据库安全性的一个有力措施
每个用户只能看见和访问所对应的外模式中的数据

内模式(Internal Schema)

1
2
3
4
5
6
7
8
9
内模式(也称存储模式)
是数据物理结构和存储方式的描述
是数据在数据库内部的表示方式
记录的存储方式(例如,顺序存储,按照B树结构存储,按hash方法存储等)
索引的组织方式
数据是否压缩存储
数据是否加密
数据存储记录结构的规定
一个数据库只有一个内模式

image-20210326210306550

数据库的二级映像功能

二级映象在数据库管理系统内部实现这三个抽象层次的联系和转换

外模式/模式映像
  
模式/内模式映像     

外模式/模式映像

1
2
3
4
5
6
7
8
9
10
模式:描述的是数据的全局逻辑结构
外模式:描述的是数据的局部逻辑结构
同一个模式可以有任意多个外模式
每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系
映象定义通常包含在各自外模式的描述中

保证数据的逻辑独立性
当模式改变时,数据库管理员对外模式/模式映象作相应改变,使外模式保持不变
应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性

模式/内模式映像

1
2
3
4
5
6
7
模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。
例如,说明逻辑记录和字段在内部是如何表示的
数据库中模式/内模式映象是唯一的
该映象定义通常包含在模式描述中
保证数据的物理独立性
当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变。
应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。
三级模式与两级映像
数据库的模式
1
2
3
即全局逻辑结构是数据库的中心与关键 
独立于数据库的其他层次
设计数据库模式结构时应首先确定数据库的逻辑模式
数据库的内模式
1
2
3
4
依赖于它的全局逻辑结构
独立于数据库的用户视图,即外模式
独立于具体的存储设备
将全局逻辑结构中所定义的数据结构及其联系按照一定的物理存储策略进行组织,以达到较好的时间与空间效率
数据库的外模式
1
2
3
4
5
面向具体的应用程序
定义在逻辑模式之上
独立于存储模式和存储设备
当应用需求发生较大变化,相应外模式不能满足其视图要求时,该外模式就得做相应改动
设计外模式时应充分考虑到应用的扩充性

特定的应用程序

1
2
3
4
在外模式描述的数据结构上编制的
依赖于特定的外模式
与数据库的模式和存储结构独立
不同的应用程序有时可以共用同一个外模式
数据库的二级映像
1
2
3
4
5
6
7
8
9
保证了数据库外模式的稳定性
从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改

数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出去

数据的存取由数据库管理系统管理
简化了应用程序的编制
大大减少了应用程序的维护和修改

总结图:

image-20210326211522305

image-20210326211536192

第一章~END~~

2021.3.26

-------- 春花秋月 夏荷冬雪 --------