第十二章 数据库技术新发展
1.试述数据库技术的发展过程。
正确答案: 答案要点: 1) 数据模型是数据库系统的核心和基础。数据库技术的三个发展阶段应该按照数据模型的进展来界定。按照数据模型的进展,数据库技术可以相应地分为三个发展阶段。 2) 数据模型的发展经历了格式化数据模型(包括层次数据模型和网状数据模型)、关系数据模型两个阶段,以面向对象数据模型为代表的非传统数据模型的阶段。 3) 同学们可以从每一代数据库系统的主要特征、代表性系统、主要成就、优点和不足来了解数据库技术的发展过程。 层次数据库系统和网状数据库系统的数据模型虽然分别为层次模型和网状模型,但实质上层次模型是网状模型的特例。它们都是格式化模型。它们从体系结构、数据库语言到数据存储管理均具有共同特征,是第一代数据库系统。 关系数据库系统支持关系模型。关系模型不仅简单、清晰,而且有关系代数作为语言模型,有关系数据理论作为理论基础。因此,关系数据库系统具有形式基础好、数据独立性强、数据库语言非过程化等特色,标志着数据库技术发展到了第二代。 第二代数据库系统的数据模型虽然描述了现实世界数据的结构和一些重要的相互联系,但是仍不能捕捉和表达数据对象所具有的丰富而重要的语义,因此尚只能属于语法模型。 第三代的数据库系统将以更加丰富的数据模型和更强大的数据管理功能为特征,从而满足传统数据库系统难以支持的新的应用要求。
2.当前数据库技术发展的主要特征是什么?
正确答案: 答案要点: 新一代数据库技术的特点是: (1)面向对象的方法和技术对数据库发展的影响最为深远 数据库研究人员借鉴和吸收了面向对象的方法和技术,提出了面向对象数据模型(简称对象模型)。该模型克服了传统数据模型的局限性,促进了数据库技术在一个新的技术基础上继续发展。 (2)数据库技术与多学科技术的有机结合 计算机领域中其他新兴技术的发展对数据库技术产生了重大影响。传统的数据库技术和其他计算机技术如,网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术移动计算技术等的互相结合、互相渗透,使数据库中新的技术内容层出不穷。 (3)面向应用领域的数据库技术的研究 在传统数据库系统基础上,结合各个应用领域的特点,研究适合该应用领域的数据库技术,如数据仓库、工程数据库、统计数据库、科学数据库、空间数据库、地理数据库等,这是当前数据库技术发展的又一重要特征。
3.试述第一、二代数据库系统的主要成就。
正确答案: 答案要点: 第一代数据库系统指层次和网状数据库系统,其代表是: (1) 1969年IBM公司研制的层次模型的数据库管理系统IMS。 (2) 美国数据库系统语言协商会CODASYL下属的数据库任务组DBTG对数据库方法进行了系统的研究、探讨,于20世纪60年代末70年代初提出了若干DBTG报告。DBTG 报告确定并建立了数据库系统的许多概念、方法和技术。DBTG所提议的方法是基于网状结构的。它是数据库网状模型的典型代表。在DBTG方法和思想的指引下数据库系统的实现技术不断成熟,开发了许多商品化的数据库管理系统,它们都是基于网状模型或层次模型的。 可以说,层次数据库是数据库系统的先驱,而网状数据库则是数据库概念、方法、技术的奠基。它们是数据库技术中研究得最早的两种数据库系统。 支持关系数据模型的关系数据库系统是第二代数据库系统。 20世纪70年代是关系数据库理论研究和原型开发的时代,其中以IBM San Jose研究室开发的System R和Berkeley大学研制的INGRES为典型代表。经过大量的高层次的研究和开发取得了一系列的成果,主要是: (1)奠定了关系模型的理论基础,给出了人们一致接受的关系模型的规范说明。 (2)研究了关系数据语言,有关系代数、关系演算、SQL语言及QBE等。这些描述性语言一改以往程序设计语言和网状、层次数据库系统中数据库语言的风格,以其易学易懂的优点得到了最终用户的喜爱,为20世纪80年代数据库语言标准化打下了基础。 (3)研制了大量的RDBMS的原型,攻克了系统实现中查询优化、并发控制、故障恢复等一系列关键技术。不仅大大丰富了DBMS实现技术和数据库理论,更重要的是促进了RDBMS产品的蓬勃发展和广泛应用。 在计算机领域中把20世纪70年代称为数据库时代。20世纪80年代几乎所有新开发的系统均是关系的。关系数据库系统从实验室走向了社会,数据库技术日益广泛地应用到企业管理、情报检索、辅助决策等各个方面,成为实现和优化信息系统的基础和基本技术。
4.第三代数据库系统的主要特点是什么?
正确答案: 经过多年的研究和讨论,对第三代数据库系统的基本特征已有了共识。 (1)第三代数据库系统应支持数据管理、对象管理和知识管理 除提供传统的数据管理服务外,第三代数据库系统将支持更加丰富的对象结构和规则,应该集数据管理、对象管理和知识管理为一体。由此可以导出第三代数据库系统必须支持OO数据模型。 (2)第三代数据库系统必须保持或继承第二代数据库系统的技术 第三代数据库系统应继承第二代数据库系统已有的技术,如第二代数据库系统的非过程化数据存取方式和数据独立性。不仅能很好的支持对象管理和规则管理,而且能更好地支持原有的数据管理,支持多数用户需要的即席查询等。 (3)第三代数据库系统必须对其他系统开放 数据库系统的开放性表现在:支持数据库语言标准;在网络上支持标准网络协议;系统具有良好的可移植性、可连接性、可扩展性和可互操作性等。
5.试述数据模型在数据库系统发展中的作用和地位。
正确答案: 答案要点: (1)数据模型是数据库系统的核心和基础。 (2)数据库的发展集中表现在数据模型的发展。
6.请用实例阐述数据库技术与其他学科的技术相结合的成果。
正确答案: 答案要点: 数据库技术与其他学科的内容相结合,是新一代数据库技术的一个显著特征,涌现出各种新型的数据库系统(如图所示)。例如: • 数据库技术与分布处理技术相结合,出现了分布式数据库系统; • 数据库技术与并行处理技术相结合,出现了并行数据库系统; • 数据库技术与人工智能技术相结合,出现了知识库系统和主动数据库系统; • 数据库技术与多媒体技术相结合,出现了多媒体数据库系统; • 数据库技术与模糊技术相结合,出现了模糊数据库系统; 等等。
7.请阐述以下数据库系统的主要概念、研究的主要问题及其发展过程: 分布式数据库系统、并行数据库系统、主动数据库系统、多媒体数据库系统、模糊数据库系统。
正确答案: 答案要点: 下面仅仅给出有关概念,它们研究的主要问题及其发展过程请参见《概论》。 分布式数据库系统:分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立处理的能力(称为场地自治),可以执行局部应用。同时,每个结点也能通过网络通信子系统执行全局应用。(参见《概论》12.2.2与14.1.1) 并行数据库系统:并行数据库系统是在并行机上运行的具有并行处理能力的数据库系统。并行数据库系统是数据库技术与并行计算技术相结合的产物。(参见《概论》12.2.2与15.1) 主动数据库系统:主动数据库是相对于传统数据库的被动性而言的。主动数据库能根据数据库的当前状态,主动适时地做出反应,执行某些操作,向用户提供有关信息。主动数据库是传统数据库技术与人工智能技术、面向对象技术相结合的产物。(参见《概论》12.2.2) 多媒体数据库系统:可实现对格式化和非格式化的多媒体数据的存储、管理和查询的数据库系统。(参见《概论》12.2.2) 模糊数据库系统:存储、组织、管理和操作模糊数据的数据库系统。(参见《概论》12.2.2)
8.试述数据仓库的产生背景。
正确答案: 答案要点: 1) 数据库技术的发展和广泛应用使许多部门、企业积累了大量的原始数据,这些数据是宝贵的资源 2) 对这些数据的分析和利用可以了解企业运行的情况,发现存在的问题,预测未来的趋势。 3) 数据库系统作为数据管理的先进技术已经成功用于事务处理。但是它对分析处理的支持一直不能令人满意,具体表现在: (1)分析处理时性能低。 (2)分析的数据对象分散,而且不一致,即缺乏对数据的清洗、集成能力。 (3)事务处理系统不具备动态集成的能力。 (4)系统缺乏对历史数据的有效组织和存储能力,而分析方法必须以大量的历史数据为 依托。 (5)在事务处理系统中存储的是细节数据,不适合进行分析处理,而事务处理系统又不 具备对数据的综合能力。 总之,DSS对数据在空间和时间的广度上都有了更高的要求,而事务处理环境难以满足这些要求。在事务型环境中直接构建分析型应用是一种失败的尝试。数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。但是数据仓库的主要驱动力并不是过去的缺点,而是市场商业经营行为的改变,市场竞争要求捕获和分析事务级的业务数据。(详细参见《概论》12.2.3)
9.数据仓库数据的基本特征是什么?
正确答案: 答案要点:四个基本特征是: • 数据仓库的数据是面向主题的 • 数据仓库的数据是集成的 • 数据仓库的数据是不可更新的 • 数据仓库的数据是随时间不断变化的 (参见《概论》12.2.3)
10.什么是联机分析处理?什么是数据挖掘?
正确答案: 答案要点: 联机分析处理OLAP是以海量数据为基础的复杂分析技术。 OLAP支持各级管理决策人员从不同的角度、快速灵活地对数据仓库中的数据进行复杂查询和多维分析处理,并且能以直观易懂的形式将查询和分析结果提供给决策人员,以方便他们及时掌握企业内外的情况,辅助各级领导进行正确决策,提高企业的竞争力 数据挖掘是从超大型数据库(VLDB)或数据仓库中发现并提取隐藏在内的模式的过程,这些模式是有效的、新颖的、有潜在使用价值的和易于理解的。目的是帮助决策者寻找数据间潜在的关联,发现经营者忽略的要素,而这些要素对预测趋势、决策行为也许是十分有用的信息。 (详细参见《概论》12.2.3)
11.基于数据库技术的DSS解决方案是什么?
正确答案: 基于数据库技术的DSS的解决方案是: DW+OLAP+DM DSS的可行方案 数据仓库、联机分析处理和数据挖掘是作为三种独立的信息处理技术出现的。数据仓库用于数据的存储和组织,OLAP集中于数据的分析,数据挖掘则致力于知识的发现。由于这三种技术内在的联系性和互补性,将它们结合起来是一种新的DSS构架。是DSS有效而可操作的整体解决方案。 (详细参见《概论》12.2.3)
12.什么是工程数据库?
正确答案: 工程数据库是一种能存储和管理各种工程设计图形和工程设计文档,并能为工程设计提供各种服务的数据库。 主要应用于CAD/CAM,CIM,CASE等工程应用领域。 工程数据库中,由于传统的数据模型难以满足工程应用的要求,需要运用新的模型技术,如扩展的关系模型、语义模型、面向对象的数据模型。 工程数据库管理系统的功能与传统数据库管理系统有很大不同,详细参见《概论》12.2.3。
13.什么是统计数据库?
正确答案: 统计数据库是一种用来对统计数据进行存储、统计、分析的数据库系统。 统计数据具有层次型特点,但并不完全是层次型结构。统计数据也有关系型特点,但关系型也不完全满足需要。统计数据具有一些特殊的性质,例如: (1) 分类属性和统计属性 (2) 多维性 (3) 分类属性的层次结构 (4) 微数据和宏数据之分 统计数据库中常用的操作有:抽样、邻近搜索、估计与插值、转置、聚集及复杂的分析操作。这些操作不同于关系数据库中传统的查询、增加、删除、修改操作。人们希望能从DMBS一级来支持以上的数据特性和操作。因此,研究和发展了统计数据库技术。 统计数据库在安全性方面有特殊的要求,要防止某些用户在统计数据库中利用对统计数据(如综合数据)的合法查询推导出该用户无权了解的某一个体的具体数据。
14.什么是空间数据库?
正确答案: 空间数据库系统是描述、存储和处理空间数据及其属性数据的数据库系统。 空间数据是用于表示空间物体的位置、形状、大小和分布特征等诸方面信息的数据。 空间数据的特点是不仅包括物体本身的空间位置及状态信息,还包括表示物体的空间关系(即拓扑关系)的信息。 空间数据库是随着地理信息系统(GIS)的开发和应用而发展起来的数据库新技术。目前,空间数据库系统不是独立存在的系统,它是和应用紧密结合,大多数作为地理信息系统的基础和核心的形式出现。 空间数据库的研究涉及计算机科学、地理学、地图制图学、摄影测量与遥感、图像处理等多个学科。空间数据库技术研究的主要内容包括: (1)空间数据模型 (2)空间数据查询语言 (3)空间数据库管理系统 等等。