- **数据data:**描述事物的符号记录称为数据
- 数据的语义:数据的含义称为数据的语义,数据与其语义是不可分的
- 数据库DataBase:长期存储在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按照一定的数据模型组织、描述和储存,具有较小的冗余度redundancy、较高的数据独立性和易扩展性,并可为各种用户共享。
- 数据库管理系统Database Management System, DBMS:是位于用户和操作系统之间的一层数据管理软件,主要用来科学地组织和存储数据、高效地获取和维护数据。主要有以下几个方面的功能
- 数据定义功能
- 数据组织、存储和管理
- 数据操纵功能
- 数据库的事务管理和运行管理
- 数据库的建立和维护功能
- 其他功能
- 数据库系统Database System:数据库系统是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员Database Administrator组成的存储、管理、处理和维护数据的系统
- 人工管理阶段
- 数据不保存
- 应用程序管理数据
- 数据不共享
- 数据不具有独立性
- 文件系统阶段
- 数据可以长期保存
- 由文件系统管理数据
- 数据共享性差、冗余性大
- 数据独立性差
- 数据库系统阶段
- 数据结构化
- 数据的共享性高、冗余度低且易补充
- 数据独立性高
- 数据由数据库关系系统统一管理和控制
数据库是长期存储在计算机内有组织、大量、共享的数据集合。它可以供各种用户共享,具有最小冗余度和较高的数据独立性。数据库管理系统在数据库建立、运行和维护时对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
- **概念模型:**按用户的观点来对数据和信息建模,主要用于数据库设计
- 逻辑模型和物理模型
- 逻辑模型:按计算机系统的观点对数据建模,主要用于数据库管理系统的实现
- 层次模型
- 网状模型
- 关系模型
- 面向对象 数据模型
- 对象关系数据模型
- 半结构化数据模型
- 物理模型:是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,或在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的
- 物理模型的具体实现是数据库管理系统的任务,数据库设计人员要了解和选择物理模型。
- 逻辑模型:按计算机系统的观点对数据建模,主要用于数据库管理系统的实现
- 信息世界中的基本概念
- 实体entity:客观存在并可相互区别的事物称为实体
- 属性attribute:实体所具有的某一特性称为属性
- 码key:唯一标识实体的属性集称为码
- 实体型entity type:用实体名及其属性名集合来抽象和刻画同类实体,称为实体型
- 实体集entity set:同一类型实体的集合称为实体集
- 联系relationship:实体之间的联系通常是指不同实体集之间的联系,有一对一、一对多和多对多等多种类型
- 概念模型的一种表示方法:实体-联系方法
- 数据结构:描述数据库的组成对象以及对象之间的联系
- 数据操作:是指对数据库中的各种对象(型)的示例(值)允许执行的操作的集合,包括操作及有关的操作规则
- 数据的完整性约束条件:是指一组完整性规则
- 层次模型
- 网状模型
- 关系模型
- 面向对象数据模型
- 对象关系数据模型
- 半结构化数据模型
层次模型中每个结点表示一个记录类型(实体),每个记录类型可以包含若干字段(实体的属性),结点之间的连线表示记录类型(实体)之间一对多的父子关系。
- 层次模型的数据结构
- 有且只有一个结点没有双亲结点,这个点称为根节点
- 根以外的其他结点有且只有一个双亲结点
- 层次模型的数据操纵与完整性约束
- 插入操作:没有双亲结点的结点不能插入
- 删除操作:删除双亲结点后相应的子女结点也要删除
- 层次模型的优缺点
- 优点
- 数据结构简单清晰
- 查询效率高
- 提供了良好的完整性支持
- 缺点
- 现实世界很多联系是非层次性的,用层次模型表示起来就很笨拙或难以表示
- 查询子女结点必须通过双亲结点
- 结构严密,层次命令趋于程序化
- 优点
- 网状模型的数据结构
- 允许一个以上结点没有双亲
- 一个结点可以有多于一个的双亲
- 网状模型的数据操纵与完整性约束
- 支持记录码的概念,唯一标识记录的数据项的集合
- 保证一个联系中双亲记录和子女记录是一对多的关系
- 可以支持双亲记录和子女记录之间的某些约束条件
- 网状模型的优缺点
- 优点
- 能够更为直接地描述现实世界
- 具有良好的性能,存取效率高
- 缺点
- 结构比较复杂
- 网状模型的DDL,DML复杂,并且要嵌入某一种高级语言中,用户不容易掌握,不容易使用
- 记录之间的联系是通过存取路径实现的,应用程序在访问数据时必须选择适当的存取路径,因此用户必须了解系统结构的细节,加重了编写应用程序的负担
- 优点