数据仓库与数据挖掘原理及应用(数据库应用系列教材)
分類: 图书,计算机与互联网,数据库,数据仓库/数据挖掘,
品牌: 王丽珍
基本信息·出版社:科学出版社
·页码:300 页
·出版日期:2005年
·ISBN:9787030156570
·包装版本:第1版
·装帧:平装
·开本:16
·正文语种:中文
·丛书名:数据库应用系列教材
产品信息有问题吗?请帮我们更新产品信息。
内容简介《数据仓库与数据挖掘原理及应用》全面深入地介绍了数据仓库、联机分析处理和数据挖掘的基本概念、基本原理和应用技术。全书分成三篇,数据仓库及OLAP概念、原理和技术篇的主要内容包括数据仓库的基本概念、体系结构、模型设计、创建和维护,ETL、元数据、数据集市、OLAP的基本概念、分类、模型设计;数据挖掘技术篇介绍了数据挖掘的基本理论、基本过程、常见模型的算法;工具及实例简要介绍了数据仓库产品工具的基本情况,对产品选择和评判进行了一些分析,并较详细地介绍和分析了移动通信业务数据仓库系统。
《数据仓库与数据挖掘原理及应用》可作为计算机、信息系统等专业的学生学习数据仓库、OLAP及数据挖掘技术的实用教程,也可供从事数据仓库、数据挖掘研究、设计、开发等工作的科研、工程人员等。
编辑推荐《数据仓库与数据挖掘原理及应用》是由科学出版社出版的。
目录
第一篇 数据仓库及OLAP概念、原理和技术篇
第1章 数据仓库基本概念
1 从数据库到数据仓库
2 什么是数据仓库
3 数据仓库的体系结构
4 数据仓库的数据组织
5 本章小结
习题
第2章 数据仓库中的ETL和元数据
1 ETL
2 元数据
3 外部数据
4 本章小结
习题
第3章 数据仓库模型设计
1 数据仓库模型设计方法概述
2 数据仓库设计的三级数据模型
3 数据仓库的概念模型设计
4 数据仓库的逻辑模型设计
5 数据仓库的物理模型设计
6 数据装载接设计
7 本章小结
习题
第4章 数据仓库的建立和维护
1 数据仓库的投资分析
2 数据仓库的开发方法
3 数据仓库的建立过程
4 数据仓库的维护
5 提高数据仓库性能
6 数据仓库的安全性
7 本章小结
习题
第5章 数据仓库与数据集市的关系
1 什么是数据集市
2 数据集市的类型
3 数据集市与数据仓库的区别
4 数据集市的特点
5 数据集市的开发方法
6 数据集市的建立
7 本章小结
习题
第6章 联机分析处理
1 OLAP概念
2 OLAP的基本操作
3 OLAP分类和体系结构
4 基于多维数据库的OLAP
5 OLAP的衡量和特性
6 OLAP的前端展现方式
7 OLAP的发展及展望
8 本章小结
习题
第7章 数据仓库的应用前景
1 在电信业的应用前景
2 在客户服务及营销方面的应用前景
3 在银行领域的应用前景
4 在保险业的应用前景
5 在图书馆领域的应用前景
6 成功案例分析
7 本章小结
习题
第二篇 数据挖掘技术篇
第8章 数据挖掘介绍
1 数据挖掘概述
2 数据挖掘分类
3 数据挖掘系统
4 数据预处理
5 数据挖掘与数据仓库
6 数据挖掘的应用与发展
7 本章小结
习题
第9章 描述性挖掘
第10章 分类与预测
第三篇 工具及实例介绍篇
第11章 数据仓库工具仓库
第12章 Cognos介绍
第13章 移动通信业务数据仓库系统
主要参考文献
……[看更多目录]
序言近年来,我国高等教育事业飞跃发展,在校学生人数突飞猛进,与此同时,高校教育改革逐渐冲破旧的计划经济模式,新的模式也正在建立。在这种形势下,旧的教材体系已不能适应新的需要,因此迫切需要建立新的教材体系。基于此种情况,我们以计算机相关专业中的数据库系统教材为依托,组织了一套适应不同需求、不同层次、不同目标的数据库系列教材,其组织依据是:
1.在高等学校中随着老校的调整与改革,新校的不断涌现,过去计划经济的一刀切模式已逐渐改变,各校在培养目标、人才市场定位方面已出现多种模式(如研究型、应用型、开发型等),因此需要有多种不同数据库系统教材以适应不同模式的需求,而现有教材大多只能适应少数模式的需求。
2.近年来计算机应用飞速发展,计算机与其他专业的交叉应用发展很快,如文科中的数量经济、信息管理、电子商务、财政金融等专业,理工科中的机械、建筑、城市规划、遥感遥测等都急需开设计算机及数据库等相应课程,也需相应的教材,而此方面的合适教材目前较为少见。
3.随着教学改革的深入,数据库课程自身也需进行改革,它除了需要有主课程外,还需要有若干门配套的辅助性课程与教材,如数据库分析与设计、wleb数据库、数据库应用等课程,以及数据库实验课、实习课以及习题集等配套教材。此外,还需配合使用现代化手段如电子教案及课件等相关音像制品。所有这些教材都需构成一个以数据库主课程为核心的有机组合的系列教材,而此方面的组合教材正是目前所缺少的。
4.数据库技术本身发展很快,而教材编写相对滞后,同时国内数据库教材又受国外教材影响较大,因此适合国情的本土化教材的建设尤为重要,因此,能编写出既适应目前技术发展水平,又能适应我国经济发展需要的数据库教材是当前之急需。
5.本系列教材能适应不同模式,不同层次、不同系科(计算机及非计算机专业)的需求,它除追求基本原理的正确性外着重在它的应用性。由于数据库是一门实用性很强的课程,我们希望学生在学了此课程后能在实际应用中发挥作用。
本系列教材正是为适应上面所述的需要而编写的,目前它以计算机及非计算机专业的本科生教材为主,并将逐渐扩充到研究生及大专层次。本系列教材采取开放性组织方式,今后将根据学科发展陆续组织出版数据库领域的优秀图书。
本系列教材的编写人员涉及各个不同层次与专业,有大量实际经验与理论水平,相信这套教材的问世能对数据库教学起一定的促进作用。
文摘插图:
2)数据仓库每一个主题所对应的源数据在源分散数据库中有许多重复或不一致之处,必须将这些数据转换成全局统一的定义,消除不一致和错误之处,以保证数据的质量;显然,对不准确,甚至不正确的数据分析得出的结果将不能用于指导企业做出科学的决策。
事实止,决策支持系统需要集成的数据。全面而正确的数据是有效地分析和决策的首要前提,相关数据收集得越完整,得到的结果就越可靠。因此,对源数据的集成是数据仓库建设中最关键,也是最复杂的一步。
1.2.3稳定性
业务系统一般只需要当前数据,在数据库中一般也只存储短期数据,因此在数据库系统中数据是不稳定的,它记录的是系统中每一个变化的瞬态。
但对于决策分析而言,历史数据是相当重要的,许多分析方法必须以大量的历史数据为依托。没有大量历史数据的支持是难以进行企业的决策分析的,因此DSS对数据在空间和时间的广度上都有了更高的要求。
在数据仓库中,数据一旦被写入就不再变化了。即数据保存到数据仓库中后,最终用户只能通过分析工具进行查询和分析,而不能修改,即数据仓库的数据对最终用户而言是只读的。由于数据仓库的查询数据量往往很大,并且查询分析的用户多是企业的高层领导,他们是所在领域的专家,但却不一定是计算机专家,所以对数据查询、查询界面的友好和数据的表示提出了更高的要求。