一、填空题
1、____________和____________一起组成了安全性子系统。
2、安全性控制的一般方法有____________、____________、____________、和____________视图的保护五级安全措施。
3、完整性约束条件作用的对象有属性、______和______三种。
4、在关系数据库的规范化理论中,在执行“分解”时,必须遵守规范化原则:保持原有的依赖关系和______。
5、“为哪些表,在哪些字段上,建立什么样的索引”这一设计内容应该属于数据库设计中的______阶段。
6、数据库系统在运行过程中,可能会发生各种故障,其故障对数据库的影响总结起来有两类:______和______。
7、数据库恢复是将数据库从______状态恢复到______的功能。
8、如果多个事务依次执行,则称事务是执行______;如果利用分时的方法,同时处理多个事务,则称事务是执行______。
9、数据仓库主要是供决策分析用的______,所涉及的数据操作主要是______,一般情况下不进行。
10、关系规范化的目的是______。
二、判断题
11、在CREATEINDEX语句中,使CLUSTERED来建立簇索引。( )
12、可以用UNION将两个查询结果合并为一个查询结果。( )
13、全码的关系模式一定属于BC范式。( )
14、可以用UNION将两个查询结果合并为一个查询结果。( )
15、并发执行的所有事务均遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的。( )
16、在关系数据库中,属性的排列顺序是可以颠倒的。( )
17、在第一个事务以S锁方式读数据R时,第二个事务可以进行对数据R加S锁并写数据的操作。( )
18、等值连接与自然连接是同一个概念。( )
19、关系中任何一列的属性取值是不可再分的数据项,可取自不同域中的数据。( )
20、连接是数据库最耗时的操作。( )
21、外模式DDL用来描述数据库的总体逻辑结构。( )
22、SQLServer有两种安全性认证模式:WindowsNT和SQLServer。( )
23、有了外模式/模式映象,可以保证数据和应用程序之间的物理性。( )
24、数据库的数据项之间无联系,记录之间存在联系。( )
25、据库操作中防止死锁的方法是禁止两个用户同时操作数据库。( )
三、选择题
26、在关系中能唯一标识元组的最小属性集称为( )。
A.外码 B.候选码 C.主码 D.超码
27、下图是雇员表(雇员ID,姓名,年龄,部门)所对应的数据文件和索引文件示意图,其中雇员ID为主码。该索引属于( )。
A.聚集、稀疏、辅索引B.非聚集、稠密、主索引
C.聚集、稀疏、主索引D.非聚集、稠密、辅索引
28、数据库管理系统的工作不包括( )。
A.定义数据库
B.对已定义的数据库进行管理
C.为定义的数据库提供操作系统
D.数据通信
29、下面关于数据库三层模式结构两层映射的说法,不正确的是( )。
A.模式与内模式映射可以实现物理数据的性
B.外模式与模式映射可以实现逻辑数据的性
C.DBMS在数据库的三层模式结构之间提供了两层映射
D.子模式与内模式映射可以实现逻辑数据的性
30、在关系代数运算中,最费时间和空间的是( )。
A.选择和投影运算
B.除法运算
C.笛卡尔积和连接运算
D.差运算
31、有关系R(X,Y,Z),主键=X;S(W,X),主键W,外键=X,参照R的属性X,关系R和关系S的元组如下所示。指出关系S中违反关系完整性规则的元组是( )。
A.(1,2)B.(2,null)C.(3,3)D.(4,1)
32、在数据库应用系统的需求分析阶段,需要进行性能分析。下列关于数据库应用系统性能指标的说法错误的是( )。
A.数据访问响应时间是指用户向数据库提交数据操作请求到操作结果返回给用户的时间
B.系统吞吐量是指在单位时间内系统能存储的数据量
C.并发用户数是指在保证单个用户查询响应时间的前提下,系统最多允许同时访问数据库的用户数量
D.系统性能指标是系统软硬件设计和选型的重要依据
33、某个数据仓库中保存有商品销售明细数据表T(商品号,数量,价格,时间),其细节数据保存期为2年,每年销售记录约有5000 万条。设前端应用需要针对这些数据进行每月重要商品销售情况与趋势分析,可供用户查询或分析的数据时间跨度最长为5年,为了提高这项分析需求的执行效率,下列方案合理且有效的是( )。
A.按月份为商品明细数据建立分区,并为商品销售明细数据建立索引,每次分析时根据细节数据实时计算生成月粒度级数据,并用于趋势分析
B.按月份为商品明细数据建立分区,并为商品销售明细数据建立索引,建立视图V1(商品号,日销售总数量,日销售总金额,日期),将V1作为数据分析源
C.在商品号属性上为T建立索引,建立物化视图V2(商品号,日销售总数量,日销售总金额,日期),每天根据T中新产生的数据对V2 进行增长式更新,并将V2作为分析数据源
D.建立物化视图V3(商品号,月销售总数量,月销售总金额,月份),每天清空V3,并根据表T重新计算V3,并将V3作为分析数据源
34、有一个关系:职工(职工号,姓名,籍贯),规定职工号的值域是8个数字字符组成的字符串,这一规则属于( )。
A.参照完整性
B.用户定义的完整性
C.实体完整性
D.关键字完整性约束
35、查询Student表中的所有非空Email信息,以下语句正确的是( )。
A.SELECT Email FROM Student WHERE Email!=NULL
B.SELECT Email FROM Student WHERE Email NOT IS NULL
C.SELECT Email FROM Student WHERE Email<>NULL
D.SELECT Email FROM Student WHERE Email IS NOT NULL
36、若关系模式R(U,F)属于3NF,则( )。
A.一定属于BCNF
B.消除了插入和删除异常
C.仍存在一定的插入和删除异常
D.属于BCNF且消除了插入和删除异常
37、下列有关范式的叙述中正确的是( )。
A.如果关系模式R∈1NF,且R中主属性完全函数依赖于码,则R 是2NF
B.如果关系模式R∈3NF,X、Y⊆U,若X→Y,则R是BCNF
C.如果关系模式R∈BCNF,若X→→Y(Y≮X)是平凡的多值依赖,则R是4NF
D.一个关系模式如果属于4NF,则一定属于BCNF;反之不成立
38、实现数据库并发控制的主要方法是( )。
A.授权 B.索引 C.日志 D.封锁
39、关于登录账号和数据库用户,下列各项表述不正确的是
( )。
A.登录账号是在服务器级创建的,数据库用户是在数据库级创建的
B.创建数据库用户时必须存在该用户的登录账号
C.数据库用户和登录账号必须同名
D.一个登录账号可以对应多个数据库用户
40、将错误的、不一致的数据在进入数据仓库之前予以更正或删除,以免影响决策支持系统决策的正确性,这一过程称为( )。
A.数据提取 B.数据转换 C.数据清洗 D.数据加载
41、关于OLAP和OLTP的叙述中错误的是( )。
A.OLTP事务量大,但事务内容比较简单且重复率高
B.OLAP的最终数据来源与OLTP不一样
C.OLAP面对决策人员和高层管理人员
D.OLTP以应用为核心,是应用驱动的
四、简答题
42、什么是数据冗余?数据库系统与文件系统相比怎样减少冗余?
43、有两张关系表: Students(SID,SName,Sex,Dept)Prizing(SID,PName,Type,PDate) Students表描述的是学生基本信息,Prizing表描述的是学生获奖信息。
①若在应用程序中经常使用如下查询语句:
SELECT S.SID,SName,PName,Type FROM Students AS S JOIN Prizing AS P ON S.SID=P.SID;
请问能否使用聚集文件提高此查询的性能?并给出原因。
②为了提高查询性能,数据库管理员在Students表的SName列上建立了一个非聚集索引SName_ind。如果应用程序使用如下语句查询数据:
SELECT*FROM Students WHERE SName like‘%华’;
请问SName_ind索引是否能够提高语句的查询速度,并给出原因。
44、分析传统RDBMS在大数据时代的局限性。
45、什么样的并发调度是正确的调度?
46、 什么是数据库镜像?它有什么用途?
五、综合题
47、表所示为关系SC的实例数据,其中:Sno为学号、Cno为课程号、Ctitle为课程名、Iname为教师名、Iloca为教师地址,Grade为成绩。
表6-2 关系SC的实例数据
(1) 该关系为第几范式?
(2) 是否存在插入、删除异常?若存在,请说明是在什么情况下发生?发生的原因是什么?
(3) 请将它分解为高一级范式。
(4) 分解后的关系能否解决操作异常问题?
48、设计一个程序采用游标方式输出求每个学生的班号、学号、姓名、课程名和分数,并以班号和学号排序,给出程序的执行结果。
49、图是有关学生(student)和学习(study)信息的对象联系图。其中,coursename表示课程名,grade表示成绩,study的city表示求学地,university表示大学,sno表示学号,sname表示姓名,student的 city表示籍贯。
(1) 试解释这个对象联系图。
(2) 试用ORDB的定义语言定义这个数据库。
(3) 试用ORDB的查询语言,分别写出下列查询的SELECT语句:
①检索每个学生的学习课程和成绩。
②检索至少有一门课程的求学地与出生地在同一城市的学生学号和姓名。
(4) 试用ODMG C++ODL定义这个数据库。
学生和学习信息的对象联系图
参
一、填空题
1、【答案】用户权限定义;合法权检查机制
2、【答案】用户标识与系统鉴定;存取控制;审计;数据加密
3、【答案】关系;元组
4、【答案】无损连接
5、【答案】物理设计
6、【答案】数据库本身未被破坏;数据库处于不一致状态
7、【答案】错误;某一已知的正确状态
8、【答案】串行;并行
9、【答案】数据查询;修改操作
10、【答案】控制冗余,避免插入和删除异常,从而增强数据库结构的稳定性和灵活性
二、判断题
11、【答案】对
12、【答案】对
13、【答案】对
14、【答案】对
15、【答案】对
16、【答案】对
17、【答案】错
18、【答案】错
19、【答案】错
20、【答案】对
21、【答案】错
22、【答案】错
23、【答案】错
24、【答案】错
25、【答案】错
三、选择题
26、【答案】B
【解析】超码(Super Key)是关系中能唯一标识每个元组的属性或属性组(集),一个关系可能有多个超码。
候选码(Candidate Key)是关系中能唯一标识每个元组的最小属性或属性组,一个关系可能有多个候选码;主码(Primary Key)则是从候选码中选择一个,作为该关系的主码。数据库系统将按主码标识和排序每个元组。一个关系在任一时刻至多只能有一个主码,但在不同时刻可以指定不同的候选码作为主码。
外码(Foreign Key)则是在关系R1中的属性或属性组,若在另一个关系R2中作为主码使用,则称该属性或属性组为R1的外码。R1的外码和R2中的主码必须定义在相同的域上,允许使用不同的属性名。
27、【答案】B
【解析】聚集索引和非聚集索引:对数据文件和它的一个特定的索引文件,如果数据文件中数据记录的排列顺序与索引文件中索引项的排列顺序相一致,则该索引文件成为聚集索引,否则,成为非聚集索引。稠密索引和稀疏索引:如果数据文件中的每个查找码值在索引文件中都对应一个索引记录,则该索引称为稠密索引,否则称为稀疏索引。主索引和辅索引:在数据文件包含主码的属性集上建立的索引称为主索引,在非主属性上建立的索引称为辅索引。由题意和定义可知,该索引是非聚集、稠密、主索引。
28、【答案】C
【解析】DBMS的功能主要有数据库定义、数据库操纵、数据库运行控制、数据库建立及维护和数据通信等。
29、【答案】D
【解析】数据库三层模式体系结构的目的是将用户的数据库逻辑视图与数据库的物理描述分离开来。外模式与概念模式之间的映射,它把用户数据库与概念数据库联系起来了。这一层的映射可以保证逻辑数据性,即外模式不受概念模式变化的影响。概念模式与内模式之间的映射,它把概念数据库与物理数据库联系起来了。这一层的映射可以保证物理数据性,即概念模式不受内模式变化的影响。
30、【答案】C
【解析】在关系代数运算中,最费时间和空间的是笛卡尔积和连接运算,所以尽可能放在后面做。
31、【答案】C
【解析】关系完整性有三类:实体完整性、参照完整性和用户自定义的完整性。其中参照完整性保证当数据与数据之间有联系时,这种联系造成数据取值的制约。参照完整性规则是:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对。
对于S关系而言,X是该关系的外码,它与R关系的主码X相对应。根据参照完整性规则,S关系中X的取值或者取空值或者等于R中X的某个分量值。因此,S关系中X的分量值为3这一元组就是违背参照完整性规则的元组。
32、【答案】B
【解析】性能需求分析主要包含:①数据操作响应时间,指用户向数据库系统提交数据操作请求到返回用户操作结果的时间;②系统吞吐量,指系统在单位时间内可以完成的数据库事务或数据查询的数量。系统吞吐量可表示为每秒事务数TPS;③允许并发访问的最大用户数,指在保证单个用户查询响应时间的前提下,系统最多允许多少用户同时访问数据库;④每TPS代价值(Price per TPS),用于衡量系统性价比的指标。
33、【答案】C
【解析】如果每次分析都根据细节数据实时计算,生成月粒度级数据,那么数据量大时效率就会很低。视图是虚表,并不占用存储空间,所以建立视图与提高效率无关。每天清空V3并根据表T重新计算V3,将V3作为分析数据源,并不能提高效率。只有C项方案比较合理有效。
查询处理器是数据库管理系统的重要组成部分,
34、【答案】B
【解析】用户定义的完整性是针对某一具体数据库的约束条件,它反映某一具体应用涉及的数据必须满足语义要求;而规定学号的值域是8个数字字符组成的字符串显然属于这一类型。
35、【答案】D
【解析】在数据库T-SQL语句中,WHERE子句表示条件,用IS NULL来表示空的记录,IS NOT NULL表示非空信息。
36、【答案】C
【解析】各级范式之间的联系有下述关系:
1NF⊃2NF⊃3NF⊃BCNF⊃4NF⊃5NF。因此,达到3NF,不一定属于 BCNF。事实上,达到3NF还不能解决所有的异常问题,还会出现数据操纵的异常问题。在函数依赖的范畴内,只要达到BCNF就可达到最高的规范化程度,就可避免数据操纵的异常问题。
37、【答案】D
【解析】2NF和3NF关系讨论的都是非主属性与候选码间的函数依赖关系,所以A项是错误的;BCNF要求每一个函数依赖的左部都包含R的候选码,所以B项是错误的;4NF要求每一个多值依赖的左部都包含R的候选码,所以C项是错误的。
38、【答案】D
【解析】数据库管理系统对事务的并发执行进行控制,以保证数据库一致性,最常用的方法是封锁的方法,即当一个事务访问某个数据项时,以一定的方式锁住该数据项,从而其他事务对该数据项的访问。
39、【答案】C
【解析】登录账户属于SQL Server服务安全防线,用户只有拥有SQL
Server服务登录账户,才能与SQL Server建立链接;数据库用户属于
SQL Server数据库安全防线,SQL Server中的每个数据库都有自己的用户和角色,该数据库只能由它的用户和角色访问。它们是不同级别的账号,它们需要绑定,创建数据库用户时必须存在该用户的登录账号,一个登录账号可以对应多个数据库用户,但不需要同名。
40、【答案】C
41、【答案】C
【解析】OLAP与OLTP一样,最终数据来源都是来自底层的数据库系统,但是由于两者的使用用户不同。
四、简答题
42、答:(1)数据冗余
数据冗余是指各个数据文件中存在重复的数据。在文件管理系统中,数据被组织在一个个的数据文件中,每个文件都有完整的体系结构,对数据的操作是按文件名访问。数据文件之间没有联系,数据文件是面向应用程序的。每个应用都拥有并使用自己的数据文件,各数据文件中难免有许多数据相互重复,数据的冗余度比较大。
(2)数据库系统以数据库方式管理大量共享的数据。数据库系统由许多单独文件组成,文件内部具有完整的结构,但它更注重文件之间的联系。数据库系统中的数据具有共享性。数据库系统是面向整个系统的数据共享而建立的,各个应用的数据集中存储,共同使用,数据库文件之间联系密切,因而尽可能地避免了数据的重复存储,减少和控制了数据的冗余。
43、答:①可以用聚集文件提高查询性能。因为聚集文件将不同关系表中有关联关系的记录存储在一起,减少了系统的物理I/O操作次数,提高了查询性能。
②此索引不能提高该语句的查询速度。因为该索引是建立在
SNAME上的非聚集索引,以SNAME首字母排序,而查询语句查询的名字是最后一个“华”的SNAME,所以仍然需要全部扫描students表,因此不能提高该语句的查询速度。
44、答:关系数据库在大数据时代丧失了互联网搜索这个机会,其主要原因是关系数据库管理系统(并行数据库)的扩展性遇到了前所未有的障碍,不能胜任大数据分析的需求,关系数据管理模型追求的是高度的一致性和正确性,面向超大数据的分析需求。
45、答:可串行化的调度是正确的调度。
可串行化的调度是指多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行执行它们时的结果相同的调度可串行化的调度为:
46、答:(1)数据库镜像即根据DBA的要求,自动把整个数据库或者其中的部分关键数据复制到另一个磁盘上。每当主数据库更新时,
DBMS自动把更新后的数据复制过去,即DBMS自动保证镜像数据与主数据的一致性。
(2)数据库镜像的用途有两点:
①用于数据库恢复,当出现介质故障时,可由镜像磁盘继续提供使用,同时DBMS自动利用镜像磁盘数据进行数据库的恢复,不需要关闭系统和重装数据库副本。
②提高数据库的可用性,在没有出现故障时,当一个用户对某个数据加排它锁进行修改时,其他用户可以读镜像数据库上的数据,而不必等待该用户释放排它锁。
五、综合题
47、答:(1)因为该关系的码为(Sno,Cno),其余均为非码属性,显然非码属性Ctitle对码存在部分函数依赖,因此SC没有达到2NF,只达到1NF。
(2)该关系在进行数据操纵时会出现插入异常和删除异常:当增加一门新课,而没有学生选该课时,不能加入该课程信息,从而发生插入异常;当只有一位学生选某门课,删除该学生时会把该课程的信息也删除了,从而发生删除异常。原因在于非码属性Ctitle、Iname、Iloca均部分依赖于码(Sno,Cno)。(3)要想使它由1NF规范化为2NF,可以通过关系分解,去除关系中存在的非码属性对码的部分依赖。分解后为两个关系SG和CI:
SG(Sno,Cno,Grade)
CI(Cno,Cname,Iname,Iloca)
在上述两个关系中均不存在非码属性对于码的部分函数依赖,均达到2NF。
(4)分解后的关系能解决1NF时出现的上述操作异常问题,但是还会存在新的操作异常:新来的老师还未任课,出现新教师插入异常;取消某门课,会发生删除异常。因此,还可以对该关系继续分解,进一步规范化,达到更高的规范化程度,避免数据操纵的异常情况。
【解析】判断一个关系达到第几范式,首先必须明确关系的码,这样才能确定该关系的非码属性有哪几个,然后再判断各个非码属性与码的关系,从而确定该关系规范化程度。在函数依赖范畴内:
①如果存在非码属性对于码的部分函数依赖,则该关系没有达到
2NF,只达到1NF。
②如果不存在非码属性对于码的部分函数依赖,但是存在非码属性对于码的传递函数依赖,则该关系达到2NF,没有达到3NF。
③如果不存在非码属性对于码的部分函数依赖,也不存在非码属性对于码的传递函数依赖,则该关系达到3NF。
④如果该关系每个函数依赖的决定因素都包含码,则该关系达到BCNF。
48、答:对应的程序如下:
本程序的执行结果如下:
49、答:(1)对象student包含学号、姓名、籍贯等属性,对象study包含成绩、课程名、求学地和大学等属性。student和study间联系为1:n。
(2) 使用ORDB定义这个数据库如下:
(3) 对应的ORDB的查询语句如下:
对应的ORDB的查询语句如下:
(4) 使用ODMG C++ODL定义这个数据库的语句如下:下载本文