4.1数据库基本概念
考点1数据库的基本概念
1.信息
信息(Information)是现实世界事物的存在方式或运动状态的反映。
2.数据
数据(Data)是用于描述现实世界事物的符号记录,包括数字、文字、图形和声音等。数据有多种表现形式,是信自、表达方式的一种。
3.信息与数据的关联
数据是信息的符号表示,或称载体;信息是数据的内涵,是数据的语义解释。信息与数据是密切相关联的,因此,在某些不需要严格区分的场合,也可以把两者不加区别地使用,例如信息处理也可以说成数据处理。
4.数据库
数据库(DataBase,简称DB)是长期存储在计算机内的有组织的、可共享的数据集合。其数据是按一定的数据模型组织、描述和存储的,具有较小的冗余度、较高的数据独立性和易扩展性,并可为一定范围内的各种用户共享
5.数据库管理系统
数据库管理系统(DataBase Management System,简称DBMS)是指负责数据库存取、维护和管理的系统软件。它的基本功能有:数据定义功能、数据操作功能、数据库的运行管理和数据库的建立、维护功能。
6.数据库系统
数据库系统(DataBase System,简称DBS )是指在计算机系统中引人数据库后的系统构成。一般由数据库、操作系统、数据库管理系统(及其工具)、应用系统、数据库管理人员和用户构成。
考点2数据管理技术发展的3个阶段
数据管理技术的发展同计算机硬件、软件和计算机应用的范围有着密切关系。它是对数据的分类、组织、编码、存储、检索和维护的技术,其发展经过如下3个阶段:
1.人工管理阶段
该阶段具有如下几个特点:
(1)数据不保存。
(2)由应用程序管理数据。
(3)数据不共享。
(4)数据不具有独立性。
2.文件系统阶段
该阶段具有如下几个特点:
(1)数据可以长期保存。
(2)由文件系统管理数据。
(3)数据共享性差,冗余度大。
(4)数据独立性差。
3.多数据库系统阶段
与前边两个相比,数据库系统阶段具有如下几个方面的特点:
(1)数据结构化。
(2)数据的共享性高,冗余度低,易扩充。
(3)数据独立性高。
(4)数据由DBMS统一管理和控制。
考点3数据库技术的研究领域
数据库技术的研究领域是十分广泛的,概括地讲可包括以下3个领域:
(1)数据库管理系统软件的研制。
(2)数据库设计。数据库设计的主要任务是在DBMS的支持下,按照应用的要求,为某一部门或组织设计一个结构合理、使用方便、效率较高的数据库及其应用系统。
(3)数据库理。论数据库理论的研究主要集中于关系规范化理论和关系数据理论等。
4.2数据模型
考点4数据模型的概念
模型是指现实世界的模拟和抽象数据模型是数据库系统的数学形式框架,是数据库系统的核心和基础。根据模型应用的不同,可以将模型分为两类:第一类模型是概念模型,也称信息模型。另一类模型是结构模型,主要包括网状模型、层次模型和关系模型等。
考点5数据模型的要素
数据模型通常由数据结构、数据操作和完整性约束3部分组成。
1.数据结构
数据结构是所研究的对象类型的集合,用于描述系统的静态特征。数据的静态特征是指对数据结构和数据间联系的描述。数据结构是刻画一个数据模型性质最重要的方面。
2.数据操作
数据操作是指对数据库中各种对象的实例允许执行的操作的集合,包括操作及相关的操作规则。
3.数据完整性约束
数据完整性约束是一组完整性规则的集合完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态及状态的变化,以保证数据的正确、有效和相容。
考点6概念模型E-R模型
为了将现实世界中的具体事物抽象组织为某一DBMS支持的数据模型,一般先将现实世界抽象为信息世界,然后将信息世界转换成机器世界。概念模型实际上是现实世界到机器世界的一个中间层次。
1.信息世界中的羞本概念
(1)实体(Entity):客观存在并可相互区别的事物称为实体,它可以是具体的人、事、物,也可以是抽象的概念或联系。
(2)属性(Attribute):实体所具有的某一特性称为属性。
(3)主码(Primary Key):唯一标识实体的属性集称为主码。
(4)域(Domain):属性的取值范围称为该属性的域。
(5)实体型(Entity Type):具有相同属性的实体必然具有共同的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。
(6)实体集(Entity Set):同型实体的集合称为实体集。
(7)联系(Relationship):在现实世界中,事物内部及事物之间是有联系的,这些联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系。两个实体之间的联系可以分为3类:一对一联系(1:1)、一对多联系(1:n),以及多对多联系(m: n)。
2.概念模型的表示方法
概念模型的表示方法很多,其中最为著名的是1976年P. P. S. Chen提出的实体一联系方法(Entity - Re-tionship Approach) o该方法用E-R图来描述现实世界的概念模型,称为实体一联系模型,简称E-R模型。
E-R图提供了表示实体型、属性和联系的方法。
(1)实体型:用矩形表示,矩形框内写明实体名。
(2)属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。
(3)联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型。
考点7常用的数据结构模型
目前,数据库领域中最常用的数据模型有4种,它们是:层次模型、网状模型、关系模型及面向对象模型。其中层次模型和网状模型统称为非关系模型。
1.层次模型(Hierarchical Model)
层次模型是数据库系统中最早出现的数据模型,用树型结构来表示各类实体及实体间的联系。层次模型的查询效率很高,曾得到广泛应用,但它只能表不I:N联系,对数据进行查询和更新操作时则很复杂,所以编写应用程序也很复杂。
2.网状模型(Network Model)
用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。网状数据模型的特点是记录之间的联系通过指针来实现,M: N联系容易实现,查询效率较高,但是编写应用程序较复杂,程序员必须熟悉数据库的逻辑结构,而月_其DDI,和DMI,语言复杂,用户不容易使用。
3.关系模型(Relational Model )
关系模型是目前最重要的一种数据模型。关系数据库系统采用关系模型作为数据库的组织方式。它是由美国IBM公司San Jose研究室的研究员E. F. Codd首次提出的用表格形式结构表示实体类型及实体间联系的模型称为关系模型关系模型中数据的逻辑结构是一张二维表,它由行和列组成。关系模型的数据结构简单,容易被初学者接受它是一个成熟的、有前途的模型,已得到广泛应用。
4.面向对象模型(Object一Oriented Model)
现实世界中存在着许多含有更复杂数据结构的实际应用领域,如CAD数据、图形数据等,加上人工智能研究的需要,就导致了面向对象的数据模型。在面向对象的数据模型中,最基本的概念为对象和类。面向对象的数据模型可完整地描述现实世界的数据结构,比层次、网状、关系数据模型具有更加丰富的表达能力,能表达嵌套、递归的数据结构。
4.3.数据库系统的模式结构
考点8数据库系统模式的概念
在数据模型中有“型”和“值”的概念型是指对某一类数据的结构和属性的说明,值是型的一个具体赋值。
模式是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及到型的描述,不涉及到具体的值。模式的一个具体值称为模式的一个实例一模式是相对稳定的,反映的是数据的结构和联系,而实例是相对变动的,反映的是数据库某一时刻的状态。
考点9数据库系统的三级模式结构
数据库系统的三级模式结构是指数据库系统是由外模式、模式和内模式三级构成的。
1.模式(Schema)
模式也称概念模式或逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。模式实际[是数据库数据在逻辑级上的视图。定义模式时不仅要定义数据的逻辑结构,而且要定义数据之间的联系,定义与数据有关的安全性、完整性要求。一个数据库只有一个模式。
2.外模式(External Schema)
外模式也称子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式通常是模式的子集。一个数据库可以有多个外模式。外模式是保证数据库安全性的一个有力措施。
3.内模式(Internal Schema)
内模式也称存储模式或物理模式,一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。
考点10数据库的二层映像与数据独立性
数据库管理系统为了能够在内部实现数据库三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映像:外模式/模式映像和模式/内模式映像。
这两层映像保证r数据库系统中的数据能够具有较高的逻辑独立性和物理独立性
1.外模式/模式映像
外模式描述的是数据的局部逻辑结构,模式描述的是数据库数据的全局逻辑结构。对应于同一个模式可以有任意多个外模式对于每一个外模式,数据库系统都有一个外模式/模式映像,它定义了该外模式与模式之间的对应关系。外模式/模式映像保证了数据与程序的逻辑独立性。
2.模式/内模式映像
数据库中只有一个模式,也只有一个内模式,所以模式/内模式映像是唯一的,它定义了数据库全局逻辑结构与存储结构之间的对应关系模式/内模式映像保证了数据与程序的物理独立性。
4.4关系数据库系统概述
考点11关系数据库系统
关系数据库系统是支持关系数据模型的数据库系统。关系数据库应用数学方法来处理数据库中的数据最早提出将这类方法用于数据处理的是1962年CODASYL发表的“信息代数”一文,但系统而严格地提出关系模型的是美国IBM公司的E. F. Codd。