数据是计算机操作对象的总称,它是计算机处理的符号的集合,集合中的个体为一个数据元素。数据元素可以是不可分割的原子,也可以由若干数据项合成,因此在数据结构中讨论的基本单位是数据元素,而最小单位是数据项。
数据结构是由若干特性相同的数据元素构成的集合,且在集合上存在一种或多种关系。由关系不同可将数据结构分为四类:线性结构、树形结构、图状结构和集合结构。数据的存储结构是数据逻辑结构在计算机中的映象,由关系的两种映象方法可得到两类存储结构:一类是顺序存储结构,它以数据元素相对的存储位置表示关系,则存储结构中只包含数据元素本身的信息;另一类是链式存储结构,它以附加的指针信息(后继元素的存储地址)表示关系。数据结构是一门讨论"描述现实世界实体的数学模型(非数值计算)及其上的操作在计算机中如何表示和实现"的学科。 数据结构是一门讨论"描述现实世界实体的数学模型(非数值计算)及其上的操作在计算机中如何表示和实现"的学科。
数据结构其操作集不同,但下列操作必不可缺:
1) 结构的生成;
2) 结构的销毁;
3) 在结构中查找满足规定条件的数据元素;
4) 在结构中插入新的数据元素;
5) 删除结构中已经存在的数据元素;
6) 遍历。
数据结构的操作是和数据结构本身密不可分的,两者作为一个整体可用抽象数据类型进行描述。抽象数据类型是一个数学模型以及定义在该模型上的一组操作,因此它和高级程序设计语言中的数据类型具有相同含义,而抽象数据类型的范畴更广,它不局限于现有程序设计语言中已经实现的数据类型(它们通常被称为固有数据类型),但抽象数据类型需要借用固有数据类型表示并实现。抽象数据类型的三大要素为数据对象、数据关系和基本操作,同时数据抽象和数据封装是抽象数据类型的两个重要特性。
抽象数据类型的形式描述为:
ADT = ( D,S,P )
其中:D 是数据对象,
S 是 D 上的关系集,
P 是 D 的基本操作集。
ADT 抽象数据类型名 {
数据对象: 数据对象的定义
数据关系: 数据关系的定义
基本操作: 基本操作的定义
} ADT 抽象数据类型名
其中,数据对象和数据关系的定义用伪码描述,基本操作的定义格式为
基本操作名(参数表)
初始条件:〈初始条件描述〉
操作结果:〈操作结果描述〉
算法是进行程序设计的另一不可缺少的要素。算法是对问题求解的一种描述,是为解决一个或一类问题给出的一种确定规则的描述。一个完整的算法应该具有下列五个要素:有穷性、确定性、可行性、有输入和有输出。一个正确的算法应对苛刻且带有刁难性的输入数据也能得出正确的结果,并且对不正确的输入也能作出正确的反映。
算法效率的衡量方法
算法的时间复杂度是比较不同算法效率的一种准则,算法时间复杂度的估算基于算法中基本操作的重复执行次数,或处于最深层循环内的语句的频度。算法空间复杂度可作为算法所需存储量的一种量度,它主要取决于算法的输入量和辅助变量所占空间,若算法的输入仅取决于问题本身而和算法无关,则算法空间复杂度的估算只需考察算法中所用辅助变量所占空间,若算法的空间复杂度为常量级,则称该算法为原地工作的算法。
个算法的"运行工作量"通常是随问题规模的增长而增长,因此比较不同算法的优劣主要应该以其"增长的趋势"为准则。假如,随着问题规模 n 的增长,算法执行时间的增长率和f(n)的增长率相同. F(n)=Q(n) 称T(n)为算法的(渐近)时间复杂度。
"
"的数学含义是,若存在两个常量 C 和,当 时,|T(n)|<=C|f(n)|,记做,fT(n)=O(f(n)).它表明算法的执行时间是和f(n)"同数量级"的。 "渐近"是相对其它时间复杂度而言,但由于在本课程中不讨论其它类型的时间复杂度,故以后均简称时间复杂度。算法效率的衡量方法
任何一个算法都是由一个"控制结构"和若干"原操作"组成的,因此一个算法的执行时间可以看成是所有原操作的执行时间之和
∑( 原操作(i)的执行次数
原操作(i)的执行时间 )则算法的执行时间与所有原操作的执行次数之和成正比
"原操作"指的是固有数据类型的操作,显然每个原操作的执行时间和算法无关,相对于问题的规模是常量。同时由于算法的时间复杂度只是算法执行时间增长率的量度,因此只需要考虑在算法中"起主要作用"的原操作即可,称这种原操作为"基本操作",它的重复执行次数和算法的执行时间成正比。
算法的存储空间需求
算法的存储量指的是算法执行过程中所需的最大存储空间。算法执行期间所需要的存储量应该包括以下三部分:(1)输入数据所占空间;(2)程序本身所占空间;(3)辅助变量所占空间。
类似于算法的时间复杂度,通常以算法的空间复杂度作为算法所需存储空间的量度。定义算法空间复杂度为
S (n) = O (g(n))
表示随着问题规模n的增大,算法运行所需辅助存储量的增长率与g(n)的增长率相同。