立即注册
登录
搜索
前端开发
后端开发
虚幻引擎
U3D引擎
体感研发
数据库
论坛
BBS
本版
帖子
用户
麒麟软控
»
论坛
›
麒麟软控
›
数据库
›
数据库系统概论学习笔记(一)
返回列表
发新帖
数据库系统概论学习笔记(一)
鱼片汤
鱼片汤
当前离线
积分
20
6
主题
8
帖子
20
积分
新手上路
新手上路, 积分 20, 距离下一级还需 30 积分
新手上路, 积分 20, 距离下一级还需 30 积分
积分
20
发消息
发表于 2022-12-1 18:32:00
|
显示全部楼层
大家好,接下来我会记录一下自己学习数据库系统概论的过程!希望能够对大家期末复习有所帮助!
第一章 数据库绪论
1.1 数据库系统概述
1.1.1 数据库的四个概念
数据(Data):数据是数据库中存储的基本对象,它是描述事物的符号记录。
数据库(Database):数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。
数据库管理系统(DBMS):数据库管理系统是位于用户与操作系统之间的一层数据管理软件,它是一个大型复杂的软件系统,它主要用于科学地组织和存储数据、高效地获取和维护数据。
数据库系统(DBS):数据库系统主要是由数据库、数据库管理系统(及其开发工具)、数据库管理员以及应用程序所构成的一套人机系统。
1.1.2 数据库系统的特点
1.数据的整体结构化
数据的整体结构化是数据库的主要特征之一,它不再仅仅针对某一个应用,而是面向全组织,不仅数据内部结构化,整体也是结构化的,数据之间具有联系,数据记录可以变长,数据的最小存取单位是数据项。
2.数据的共享性高,冗余度低且易扩充
数据面向整个系统,可以被多个用户、多个应用共享使用。
数据共享的好处:
(1)、减少数据冗余,节约存储空间。
(2)、避免数据之间的不相容性与不一致性。
(3)、使系统易于扩充。
3.数据独立性高
数据独立性由数据库管理系统的二级映像功能来保证,它主要分为:物理独立性和逻辑独立性。
物理独立性:指用户的应用程序与数据库中数据的物理存储是相互独立的,当数据的物理存储改变了,应用程序不用改变。
逻辑独立性:指用户的应用程序与数据库中数据的逻辑结构是相互独立的,当数据的逻辑结构改变了,应用程序不用改变。
4.数据由数据库管理系统统一管理和控制
数据库管理系统提供的数据控制功能。
(1)、数据的安全性(Security)保护:保护数据以防止不合法的使用造成的数据的泄密和破坏。
(2)、数据的完整性(Integrity)检查:保证数据的正确性、有效性和相容性。
(3)、并发(Concurrency)控制:对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
(4)、数据库恢复(Recovery)技术:将数据库从错误状态恢复到某一已知的正确状态。
1.2 数据库数据模型
1.2.1 数据模型的描述
数据模型是对现实世界数据特征的抽象,通俗地讲数据模型就是现实世界的模拟,数据模型是数据库系统的核心和基础。
1.2.2 数据模型的要求
能比较真实地模拟现实世界。
容易为人所理解。
便于在计算机上实现。
1.2.3 数据模型的分类
数据模型分为两类(两个不同的层次):
1.概念模型:
概念模型也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。
2.逻辑模型和物理模型:
逻辑模型主要包括层次模型、网状模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。按计算机系统的观点对数据建模,用于DBMS实现。
物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
1.2.4 概念模型的概述
1.概念模型的用途
概念模型用于信息世界的建模。
是现实世界到机器世界的一个中间层次。
是数据库设计的有力工具。
数据库设计人员和用户之间进行交流的语言。
2.概念模型的要求
较强的语义表达能力。
简单、清晰、易于用户理解。
3.概念模型的表示
实体-联系方法,用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。
4.信息世界中的基本概念
实体(Entity):客观存在并可相互区别的事物称为实体。
属性(Attribute):实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。例如学生实体可以由学号、姓名、性别、出生年份、系、入学时间等属性组成。(94002268,张山,男,1976,计算机系,1994)这些属性组合起来表征了一个学生。
码(Key):唯一标识实体的属性集称为码。例如学号是学生实体的码。
域(Domain):属性的取值范围称为该属性的域。例如,学号的域为8位整数,姓名的域为字符串集合,年龄的域为小于38的整数,性别的域为(男,女)。
实体型(Entity Type) :具有相同属性的实体必然具有共同的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。例如,学生(学号,姓名,性别,出生年份,系,入学时间)就是一个实体型。
实体集(Entity Set):同型实体的集合称为实体集。例如,全体学生就是一个实体集。
联系(Relationship) :在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系。实体之间的联系通常是指不同实体集之间的联系。
5.两个实体型之间的联系
两个实体型之间的联系可以分为三类:
一对一联系(1 : 1):
如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1 : 1。例如,学校里面,一个班级只有一个正班长,而一个班长只在一个班中任职,则班级与班长之间具有一对一联系。
一对多联系(1 : n):
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1 : n。例如,一个班级中有若干名学生,而每个学生只在一个班级中学习,则班级与学生之间具有一对多联系。
多对多联系(m : n):
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体集B具有多对多联系,记为m : n。
1.2.5 数据模型的组成
数据结构
描述数据库的组成对象,以及对象之间的联系,它是对系统静态特性的描述。
数据操作
对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则,它是对系统动态特性的描述。
数据操作的类型:
(1)、查询
(2)、更新(包括插入、删除、修改)
数据的完整性约束条件
是一组完整性规则的集合,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。
完整性规则:给定的数据模型中数据及其联系所具有的制约和依存规则。
1.2.6 常见的数据模型
层次模型(Hierarchical Model)
网状模型(Network Model)
关系模型(Relational Model))
面向对象数据模型(Object Oriented Data Model)
对象关系数据模型(Object Relational Data Model)
1.2.7 层次模型
1.2.7.1 概述
定义:层次数据模型是用树状层次结构来组织数据的数据模型。
层次模型是数据库系统中最早出现的数据模型,层次数据库系统的典型代表是IBM公司的IMS(Information Management System)数据库管理系统,层次模型用树形结构来表示各类实体以及实体间的联系。
满足下面两个条件的基本层次联系的集合为层次模型:
有且只有一个结点没有双亲结点,这个结点称为根结点。
根以外的其它结点有且只有一个双亲结点。
1.2.7.2 特点
结点的双亲是唯一的。
只能直接处理一对多的实体联系。
每个记录类型可以定义一个排序字段,也称为码字段。
任何记录值只有按其路径查看时,才能显出它的全部意义。
没有一个子女记录值能够脱离双亲记录值而独立存在。
1.2.7.3 数据结构
教员学生层次数据库模型举例:
1.2.7.4 数据操纵
查询
插入
删除
更新
1.2.7.5 完整性约束条件
无相应的双亲结点值就不能插入子女结点值。
如果删除双亲结点值,则相应的子女结点值也被同时删除。
更新操作时,应更新所有相应记录,以保证数据的一致性。
1.2.7.6 优缺点
优点
层次模型的数据结构比较简单清晰。
查询效率高,性能优于关系模型,不低于网状模型。
层次数据模型提供了良好的完整性支持。
缺点
结点之间的多对多联系表示不自然。
对插入和删除操作的限制多,应用程序的编写比较复杂。
查询子女结点必须通过双亲结点。
层次命令趋于程序化。
1.2.8 网状模型
1.2.8.1 概述
定义:用有向图表示实体和实体之间的联系的数据结构模型称为网状数据模型。
网状数据库系统采用网状模型作为数据的组织方式,典型代表是DBTG系统,亦称CODASYL系统,20世纪70年代由DBTG提出的一个系统方案。
满足下面两个条件的基本层次联系的集合称为网状数据模型:
允许一个以上的结点无双亲。
一个结点可以有多于一个的双亲。
1.2.8.2 描述
实体型:用记录类型描述每个结点表示一个记录类型(实体)。
属性:用字段描述每个记录类型可包含若干个字段。
联系:用结点之间的连线表示记录类型(实体)之间的一对多的父子联系。
1.2.8.3 数据结构
学生/选课/课程的网状数据模型举例:
1.2.8.4 数据操纵
网状数据库系统(如DBTG)对数据操纵加了一些限制,提供了一定的完整性约束。
查询
插入
删除
更新
1.2.8.5 完整性约束条件
一个联系中双亲记录与子女记录之间是一对多联系。
支持双亲记录和子女记录之间某些约束条件。
1.2.8.6 优缺点
优点
能够更为直接地描述现实世界,如一个结点可以有多个双亲。
具有良好的性能,存取效率较高。
缺点
结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握。
DDL、DML语言复杂,用户不容易使用。
记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节。
1.3 数据库系统结构
从数据库应用开发人员角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构。
从数据库最终用户角度看,数据库系统的结构分为:
单用户结构
主从式结构
分布式结构
客户-服务器结构
浏览器-应用服务器结构
数据库服务器多层结构
1.3.1 数据库系统的模式概念
模式(Schema)
数据库逻辑结构和特征的描述
是型的描述,不涉及具体值
反映的是数据的结构及其联系
模式是相对稳定的
实例(Instance)
模式的一个具体值
反映数据库某一时刻的状态
同一个模式可以有很多实例
实例随数据库中的数据的更新而变动
1.3.2 数据库系统的三级模式结构
模式(Schema)
模式(也称逻辑模式)
数据库中全体数据的逻辑结构和特征的描述。
所有用户的公共数据视图。
外模式(External Schema)
外模式(也称子模式或用户模式)
数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述。
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
。
内模式(Internal Schema)
内模式(也称存储模式)
是数据物理结构和存储方式的描述。
是数据在数据库内部的表示方式。
记录的存储方式(例如,顺序存储,按照B树结构存储,按hash方法存储等)。
索引的组织方式。
数据是否压缩存储。
数据是否加密。
数据存储记录结构的规定。
1.3.3 数据库系统的二级映像功能
三级模式是对数据的三个抽象级别,二级映象在数据库管理系统内部实现这三个抽象层次的联系和转换:
外模式/模式映像
保证数据的逻辑独立性。
(1)、当模式改变时,数据库管理员对外模式/模式映象作相应改变,使外模式保持不变。
(2)、应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。
模式/内模式映像
保证数据的物理独立性。
(1)、当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变。
(2)、应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。
数据库的二级映像的主要功能:
保证了数据库外模式的稳定性。
从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改。
1.4 数据库系统的组成
数据库
数据库管理系统(及其开发工具)
数据库管理员
应用程序
1.5 数据库管理员职责
决定数据库中的信息内容和结构。
决定数据库的存储结构和存取策略。
定义数据的安全性要求和完整性约束条件。
监控数据库的使用和运行。
数据库的改进和重组。
上一篇:
用于CAZyme研究领域的数据库——dbCAN-seq数据库更新
下一篇:
玩转冷热肿瘤,得有神器!——手把手教你用TIGER数据库 ...
回复
举报
使用道具
分享
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
快速回复
返回顶部
返回列表