【数据库原理】滨江学院姜青山 期末试卷知识点笔记整理 南京信息工程大学

从历年的考卷+姜青山划的重点上整理来的~
本宝宝刚考完~两个填空题没填出来不开心~其他题目还是比较基础的~大概90+的分数吧~
以下加粗有颜色的是本次期末考涉及的。。山哥出卷涉及面还是很广的~

数据模型通常由 数据操作、数据结构、完整性约束 三要素组成
在关系中,每个属性的取值范围称为属性的域
SQL包括了数据定义、数据查询、数据操作和数据控制等功能
第一范式:每一个分量必须是不可分的数据项
要使关系模式属于
第二范式,就要消除非主属性对码的部分依赖

第三范式,就是要消除非主属性对于码的传递依赖
SQL语言中,对用户授权使用GRANT语句,而取消所授权限使用REVOKE语句
数据库处理技术经历了人工管理、文件系统、数据库系统三个发展阶段
在文件管理阶段,文件之间是相互孤立的,在数据库管理阶段,文件之间是相互联系的
在实体中能作为码的属性称为主属性,否则称为非主属性
域是实体中相应属性的取值范围
实体之间的联系类型有三种,分别为 一对一、一对多和多对多
把保存关系定义的关系称为对应数据库的元关系,一个数据库的元关系由DBMS自动建立
在列级完整性约束中,每个约束只能涉及到1个属性,在表级完整性约束中,每个约束可以涉及到多个属性
主码

约束关键字:primary key;外码约束关键字:foreign key
单值约束关键字:unique;检查约束关键字:check
create 建立 alter 修改 drop 删除
根据基本表建立一个视图时,包括建立了该视图的结构和内容两个方面
层次模型是一棵树结构,关系模型是一个二维表格结构
数据库操作系统的功能有:数据定义、数据操纵、数据控制、数据库的建立和维护
数据模型分为层次模型、网状模型、关系模型和面向对象模型四类
关系的完整性分为 实体完整性、参照完整性 和 用户定义完整性
WHERE 子句作用于基本表或视图,从中选择满足条件的元组。HAVING 短语作用于组,从中选择满足条件的组。
聚集函数只能用于 SELECT 子句和 HAVING 短语之中,而绝对不能出现在 WHERE 子句中。
WHERE 子句用于对查询的表限定,而 HAVING 短语用于对结果集中的各分组进行限定。
数据库是长期存储在计算机内、有 组织 的、可 共享 的数据集合。
DBMS是指 数据库管理系统。它是位于 用户 和 操作系统 之间的一层管理软件
数据结构是对数据系统的静态特性的描述,数据操作是对数据库系统的动态特性的描述
数据冗余可能导致的问题有 : 浪费存储空间及修改麻烦 、 潜在的数据不一致性
一个关系模式的定义格式为 :关系名(属性名1,属性名2, ,属性名n)
一个关系模式的定义主要包括:关系名、属性名、属性类型、属性长度、关键字
关系代数运算中,传统的集合运算有 并、交、差、笛卡尔积
基本的运算是:并、交、差、笛卡尔积、投影、选择
专门的关系运算有:选择、投影、连接
数据包括两个特征:静态特征、动态特征
E-R图的中文名是 实体联系图
实体完整性是指:主属性不能取空值
参照完整性是指:外码可以是空值或者另一个关系主码的有效值
对于非规范化的模式,经过 使属性域变为简单域 转变为1NF,将1NF经过 消除非主属性对码的部分依赖 转变为2NF,将2NF经过 消除非主属性对码的传递依赖 转变为3NF。
数据库系统包括:数据库、DBMS、操作系统、开发工具、计算机、用户
数据库的二级映像:外模式/模式映像,模式/内模式映像

简述数据库系统的三级模式的结构及其特点。
外模式是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
模式是数据库中全体数据的逻辑结构和特征,是所有用户的公共数据视图
内模式是数据的物理结构和存储方式,是数据在数据库内部的表示方式
外模式/模式映像保证了数据的逻辑独立性
模式/内模式映像保证了数据的物理独立性
优点:减少数据冗余,实现数据共享;提高存取效率,改善性能

简述一个完整的数据库系统的组成
数据系统由数据库、数据库管理系统(及其开发软件)、系统平台、应用系统和人员构成。优点:数据集中、高共享、低冗余、独立性高、拥有对数据的管理和控制能力。

数据的独立性包括哪两个方面?
物理独立性和逻辑独立性。物理独立性指用户的应用程序与存储在磁盘上的数据库是独立的。
逻辑独立性是指用户的应用程序和数据库的逻辑结构是相互独立的,数据库的逻辑结构变了,用户程序也可以不变

完整性约束包括哪些内容?
包括实体完整性、参照完整性、用户定义完整性。实体完整性和参照完整性是关系模型必须满足的完整性约束条件。

存取控制的方法:自主存取控制(DAC) 强制存储控制(MAC)
数据库的系统组成:数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员
数据库设计的基本步骤:需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施和维护
游标的定义:
游标是系统为用户开设的一个数据缓冲区,存放SQL语句的执行结果,每个游标区都有一个名字,用户可以通过游标逐一获取记录,并赋予主变量,交由主语言进一步处理。
关系数据库的优化方法:代数优化、物理优化
事务:所谓事务是用户定义的一个数据库操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位。
故障种类:事务故障,系统故障,介质故障,计算机病毒
并发控制:用正确的方式调度并发操作,使一个用户事务的执行结果不受其他事务的干扰,从而避免造成数据的不一致性。
可串行调度:多个事务的并发执行结果与按某一次序串行地执行这些事务时的结果相同,称这种调度策略为可串行化的调度。
可串行性是并发事务正确调度的准则。
函数依赖:设X,Y是关系R的两个属性集合,当任何时刻R中的任意两个元组中的X属性值相同时,则它们的Y属性值也相同,则称X函数决定Y,或Y函数依赖于X

数据库恢复是将数据库从错误状态恢复到某一已知的正确状态的功能
事务的一致性是指:事务必须使数据库从一个一致性状态变到另一个一致性状态。
从关系规范化理论的角度讲,一个只满足1NF的关系可能存在的四个问题是:数据冗余大、修改异常、插入异常、删除异常

如果数据库系统对事务的并发操作不加以控制,则有可能带来哪些问题?如何解决?
如果数据库系统对事务的并发操作不加以控制,则有可能带来三类问题:⑴丢失更新问题;⑵数据不一致;⑶读“脏数据”。
解决的办法:采用“封锁”技术。

数据字典的内容和作用是什么?
数据字典的内容一般包括:数据项、数据结构、数据流、数据存储和加工过程。其作用是对系统中数据做出详尽的描述,提供对数据库数据的集中管理。

什么是ER图?构成ER图的基本要素是什么?
ER图是用来描述某一组织(单位)的概念模型,提供了表示实体、属性和联系的方法。构成ER图的基本要素是实体、属性和关系

数据模型:层次模型,网状模型,关系模型。
数据库系统的三级模式结果:外模式,模式和内模式。
数据库的二级映像功能:1,外模式/模式映像。2,模式/内模式映像。
二级映像使得数据库系统中的数据能够具有较高的逻辑独立性和无理独立性。
数据独立性:(数据的物理独立性,数据的逻辑独立性)数据与程序之间的独立性使得数据的定义和描述可以从应用程序中分离出来。
数据库的系统组成:数据库系统一般由数据库,数据库管理系统(及开发工具),应用系统,数据库管理员构成。
存取控制的方法:1,自主存取控制(DAC2,强制存取控制(MAC)。
数据库设计的基本步骤:
1,需求分析。
2,概念结果设计。
3,逻辑结构设计。
4,物理结构设计。
5,数据库实施。
6,数据库运行和维护。

游标:游标是系统为用户开设的一个数据缓冲区,存放SQL语句的执行结果,每个游标区都有一个名字,用户可以通过游标逐一获取记录,并赋予主变量,交由主语言进一步处理。

关系数据库的优化方法:
1,代数优化:通过对关系代数表达式的等价变换来提高查询效率。
2,物理优化:选择高效合理的操作算法或存取路径,求得优化的查询计划,达到查询优化的目标。

事务:所谓事务是用户定义的一个数据库操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位。

故障种类:事务内部的故障,系统故障,介质故障,计算机病毒。恢复策略:
1,事务故障的恢复
   *1。反向扫描日志文件。
   *2。对改事务的更新操作执行逆操作。
   *3。继续反向扫描日志文件,查找该事务的其他更新操作,并做同样处理。
   *4。如此处理下去,直至读到此事务的开始标记,事务故障恢复就完成了。
2,系统故障恢复(是由系统在重新启动时自动完成的,不需要用户干预)
*1。正向扫描日志文件,找出在故障发生前已经提交的事务,将其事务标识记入重做队列。
*2。对撤销队列中的各个事务进行撤销理。
*3.。对重做队列中的各个事务进行重做处理。
3,介质故障的恢复(重做数据库)
*1。装入最新的数据库后备副本,使数据库恢复到最近一次转储时的一致性状态。
*2。装入相应的日志文件副本,重做已完成的事务。

介质故障的恢复需要DBA介入,但DBA只需要重装最近转储的数据库副本和有关的各日志文件副本,然后执行系统提供的恢复命令即可,具体的恢复操作仍由DBMS完成。

并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性。

可串行调度:多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行这些事务时的结果相同,称这种调度策略为可串行化的调度。

可串行性是并发事务正确调度的准则。

函数依赖:设X,Y是关系R的两个属性集合,当任何时刻R中的任意两个元组中的X属性值相同时,则它们的Y属性值也相同,则称X函数决定Y,或Y函数依赖于X

【数据库】解释关系代数中的象集、除运算

象集:本质上是一次选择行的运算和一次选择列的运算。
求x1在表A中的象集,就是先选出所有x属性中x=x1的那些行,然后选择出不包含x1的那些列。
举个栗子~
Snip20160625_58
喵喵在表A中的象集为{1,2}:
Snip20160625_55
汪汪在表A中的象集为{1,3}:
Snip20160625_56
萌萌在表A中的象集为{2,3}:
Snip20160625_57

除法:比如对于表A和表B,求A÷B。
Snip20160625_50
其实这道题的本质是求哪些人名,借的书同时包含书号1和2.
解决关系代数中的除法有三步:
1.找出表B中与A属性相同的那些列,此时可以看出书号一列是相同的,所以把这一列抽出来:
Snip20160625_51
2.求表A中各个不同x对应的象集(可以得到如下对应关系):
Snip20160625_52
3.找x的所有值,这个x要满足:x的象集是表B的子集,这就是A÷B的结果:
Snip20160625_60

【解释】对用户透明=对用户隐蔽:关系模型的存取路径对用户透明

在计算机中,从某个角度看不到的特性该特性是透明的。这个意义上的“透明”与社会生活中的透明含义恰好相反,例如计算机组织对程序员是透明的,就是说计算机组织对程序员来说是看不到的,也不需要看到的。和汉语字典里面的意思不一样。

举个栗子~:比如数据库里面,关系模型的优点之一:存取路径对用户透明,意思就是存取路径对用户隐蔽。

Snip20160625_49

【离散数学】最大元素、最小元素、极大元素、极小元素、上界、下界、最小上界(上确界)、最大下界(下确界)

设(A, ≤)是一偏序集合,B是A的子集。

最大元素、最小元素:
(1)元素b∈B是B的最大元素,如果对每一元素x∈B,x≤b
(2)元素b∈B是B的最小元素,如果对每一元素x∈B,b≤x
即:对于每一个元素,都能满足这样的偏序关系。
定理:如果B存在最大(最小)元素,那么它是唯一的。
例:如果B = {2, 3},偏序关系为“整除”,因为2和3互相不能整除,那么B没有最小元素和最大元素。

极大元素、极小元素:
(1)如果b∈B,且B中不存在元素x,使b≠x且b≤x,那么元素b∈B叫做B的极大元素。
(2)如果b∈B,且B中不存在元素x,使b≠x且x≤b,那么元素b∈B叫做B的极小元素。
即:对于极大元素,不存在元素在它偏序关系之上。对于极小元素,不存在元素在它偏序关系之下。

注意:B的最大(小)元素和极大(小)元素都必须是子集B的元素,而B的上界(下界)和最小上界(最大下界)可以是也可以不是B的元素。在定义中并没有保证这些元素的存在。在许多情况下他们是不存在的。

上界、下界:
(1)如果对每一b∈B,b≤a,那么元素a∈A叫做B的上界;
(2)如果对于如果对每一b∈B,a≤b,那么元素a∈A叫做B的上界;
上界、下界是A集合里的,可以存在很多个,也可以不存在
也就是说求上界的时候,对于每一个B里面的元素,都要和它上界们满足偏序关系,所以在集合B里面的不能有两个及以上,因为同事选择两个的话,就不满足B里面任何元素都要满足偏序关系了。

上确界、下确界:
(1)如果a是一上界并且对每一B的上界a’有a≤a’,那么元素a∈A叫做B的最小上界,记作lub;
(2)如果a是一下界并且对每一B的下界a’有a≤a’,那么元素a∈A叫做B的最大下界,记作glb
最大下界和最小上界可能存在也可能不存在,如果它们存在,则是唯一的。

如果最大值/最小值/上确界/下确界存在,那么一定是唯一的
求极大值/极小值的时候,因为只要是所有元素没有不满足的就可以,所以可以选择两个以上,其中可以有不和元素连线的。。
求上界/下界,因为是和最大最小值一样是所有的必须满足条件,所以所有元素都是要求有连线的,所以不可能存在两个及以上的元素在B集合里面。。

【操作系统】用户可通过三种方式使用计算机

操作系统作为用户与计算机硬件系统之间的接口,用户可通过三种方式使用计算机:命令方式、系统调用方式、图标-窗口方式

1.命令方式:典型的命令行方式有DOS系统和Unix系统等。

2.系统调用方式:(system call)为了达到这个目的,内核提供一系列具备预定功能的多内核函数,通过一组称为系统调用的接口呈现给用户。系统调用把应用程序的请求传给内核,调用相应的的内核函数完成所需的处理,将处理结果返回给应用程序。

3.图标-窗口方式:操作系统所提供的图形化界面