分享
 
 
 

数据仓库与数据挖掘(普通高等教育“十一五”国家级规划教材)

数据仓库与数据挖掘(普通高等教育“十一五”国家级规划教材)  点此进入淘宝搜索页搜索
  特别声明:本站仅为商品信息简介,并不出售商品,您可点击文中链接进入淘宝网搜索页搜索该商品,有任何问题请与具体淘宝商家联系。
  參考價格: 点此进入淘宝搜索页搜索
  分類: 图书,教材教辅与参考书,大学,计算机专业,
  品牌: 陈志泊

基本信息·出版社:清华大学出版社

·页码:249 页

·出版日期:2009年

·ISBN:7302197105/9787302197102

·条形码:9787302197102

·包装版本:1版

·装帧:平装

·开本:16

·正文语种:中文

·丛书名:普通高等教育“十一五”国家级规划教材

产品信息有问题吗?请帮我们更新产品信息。

内容简介《数据仓库与数据挖掘》主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。《数据仓库与数据挖掘》既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,《数据仓库与数据挖掘》都使用Microsoft SQL Server 2005进行了操作实现。《数据仓库与数据挖掘》通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。

《数据仓库与数据挖掘》每章均配有习题,习题形式为选择题、简答题和操作题,可以帮助读者进一步巩固和掌握所学知识。此外,《数据仓库与数据挖掘》提供多媒体教学课件和习题参考答案,读者可到清华大学出版社网站(http://www.tup.com.cn/)下载。

《数据仓库与数据挖掘》可以作为高等学校计算机及相关专业本科、研究生的数据仓库和数据挖掘教材,也可供相关领域的广大科技工作人员和高校师生参考。

编辑推荐《数据仓库与数据挖掘》为普通高等教育“十一五”国家级规划教材之一。

目录

第1章 数据仓库的概念与体系结构

1.1 数据仓库的概念、特点与组成

1.1.1 数据仓库的特点

1.1.2 数据仓库的组成

1.2 数据挖掘的概念与方法

1.2.1 数据挖掘的分析方法

1.2.2 数据仓库与数据挖掘的关系

1.3 数据仓库的技术、方法与产品

1.3.1 OLAP技术

1.3.2 数据仓库实施的关键环节和技术

1.3.3 数据仓库实施方法论

1.3.4 常用的数据仓库产品

1.4 数据仓库系统的体系结构

1.4.1 独立的数据仓库体系结构

1.4.2 基于独立数据集市的数据仓库体系结构

1.4.3 基于依赖型数据集市和操作型数据存储的数据仓库体系结构

1.4.4 基于逻辑型数据集市和实时数据仓库的体系结构

1.5 数据仓库的产生、发展与未来

1.5.1 数据仓库的产生

1.5.2 数据仓库的发展

1.5.3 数据仓库的未来

1.6 小结

1.7 习题

第2章 数据仓库的数据存储与处理

2.1 数据仓库的数据结构

2.2 数据仓库的数据特征

2.2.1 状态数据与事件数据

2.2.2 当前数据与周期数据

2.2.3 元数据

2.3 数据仓库的数据ETL过程

2.3.1 ETL的目标

2.3.2 ETL过程描述

2.3.3 数据抽取

2.3.4 数据清洗

2.3.5 数据转换

2.3.6 数据加载和索引

2.4 多维数据模型

2.4.1 多维数据模型及其相关概念

2.4.2 多维数据模型的实现

2.4.3 多维建模技术

2.4.4 星型模式举例

2.5 小结

2.6 习题

第3章 数据仓库系统的设计与开发

3.1 数据仓库系统的设计与开发概述

3.1.1 建立数据仓库系统的步骤

3.1.2 数据仓库系统的生命周期

3.1.3 建立数据仓库系统的思维模式

3.1.4 数据仓库数据库的设计步骤

3.2 基于SQLServer2005的数据仓库数据库设计

3.2.1 分析组织的业务状况及数据源结构

3.2.2 组织需求调研,收集分析需求

3.2.3 采用信息包图法设计数据仓库的概念模型

3.2.4 利用星形图设计数据仓库的逻辑模型

3.2.5 数据仓库的物理模型设计

3.3 使用SQLServer2005建立多维数据模型

3.3.1 SQLServer2005示例数据仓库环境的配置与使用

3.3.2 基于SQLServer2005示例数据库的多维数据模型

3.4 小结

3.5 习题

第4章 关联规则

4.1 概述

4.2 引例

4.3 经典算法

4.3.1 Apriori算法

4.3.2 FPgrowth算法

4.4 相关研究与应用

4.4.1 分类

4.4.2 SQLServer2005中的关联规则应用

4.5 小结

4.6 习题

第5章 数据分类

5.1 引例

5.2 分类问题概述

5.2.1 分类的过程

5.2.2 分类的评价准则

5.3 决策树

5.3.1 决策树的基本概念

5.3.2 决策树算法ID3

5.3.3 ID3算法应用举例

5.3.4 决策树算法C4.5

5.3.5 SQLServer2005中的决策树应用

5.3.6 决策树剪枝

5.4 支持向量机

5.5 近邻分类方法

5.5.1 最近邻分类方法

5.5.2 k近邻分类方法

5.5.3 近邻分类方法应用举例

5.6 小结

5.7 习题

第6章 数据聚类

6.1 引例

6.2 聚类分析概述

6.3 聚类分析中相似度的计算方法

6.3.1 连续型属性的相似度计算方法

6.3.2 二值离散型属性的相似度计算方法

6.3.3 多值离散型属性的相似度计算方法

6.3.4 混合类型属性的相似度计算方法

6.4 kmeans聚类算法

6.4.1 kmeans聚类算法的基本概念

6.4.2 SQLserver2005中的kmeans应用

6.5 层次聚类方法

6.5.1 层次聚类方法的基本概念

6.5.2 层次聚类方法应用举例

6.6 小结

6.7 习题

第7章 贝叶斯网络

7.1 引例

7.2 贝叶斯概率基础

7.2.1 先验概率、后验概率和条件概率

7.2.2 条件概率公式

7.2.3 全概率公式

7.2.4 贝叶斯公式

7.3 贝叶斯网络概述

7.3.1 贝叶斯网络的组成和结构

7.3.2 贝叶斯网络的优越性

7.3.3 贝叶斯网络的三个主要议题

7.4 贝叶斯网络的预测、诊断和训练算法

7.4.1 概率和条件概率数据

7.4.2 贝叶斯网络的预测算法

7.4.3 贝叶斯网络的诊断算法

7.4.4 贝叶斯网络预测和诊断的综合算法

7.4.5 贝叶斯网络的建立和训练算法

7.5 SQLServer2005中的贝叶斯网络应用

7.6 小结

7.7 习题

第8章 粗糙集

8.1 引例

8.2 分类与知识

8.2.1 等价关系和等价类

8.2.2 分类

8.3 粗糙集

8.3.1 分类的运算

8.3.2 分类的表达能力

8.3.3 上近似集和下近似集

8.3.4 正域、负域和边界

8.3.5 粗糙集应用举例

8.3.6 粗糙集的性质

8.4 辨识知识的简化

8.4.1 集合近似精度的度量

8.4.2 分类近似的度量

8.4.3 等价关系的可省略、独立和核

8.4.4 等价关系简化举例

8.4.5 知识的相对简化

8.4.6 知识的相对简化举例

8.5 决策规则简化

8.5.1 知识依赖性的度量

8.5.2 简化决策规则

8.5.3 可辨识矩阵

8.6 小结

8.7 习题

第9章 神经网络

9.1 引例

9.2 人工神经网络

9.2.1 人工神经网络概述

9.2.2 神经元模型

9.2.3 网络结构

9.3 BP算法

9.3.1 网络结构和数据示例

9.3.2 有序导数

9.3.3 计算误差信号对参数的有序导数

9.3.4 梯度下降

9.3.5 BP算法描述

9.4 SQLServer2005中的神经网络应用

9.5 小结

9.6 习题

第10章 遗传算法

10.1 概述

10.2 相关概念

10.3 基本步骤

10.3.1 概述

10.3.2 引例

10.4 算法设计

10.4.1 编码方式

10.4.2 种群规模

10.4.3 适应度函数

10.4.4 遗传算子

10.4.5 终止条件

10.5 相关研究与应用

10.6 小结

10.7 习题

第11章 统计分析

11.1 线性回归模型

11.1.1 线性回归模型的参数估计

11.1.2 线性回归方程的判定系数

11.1.3 线性回归方程的检验

11.1.4 统计软件中的线性回归分析

11.1.5 SQLServer2005中的线性回归应用

11.2 Logistic回归模型

11.2.1 Logistic回归模型的参数估计

11.2.2 统计软件中Logistic回归的结果分析

11.2.3 SQLServer2005中的Logistic回归应用

11.3 时间序列模型

11.3.1 ARIMA模型

11.3.2 建立ARIMA模型的步骤

11.3.3 使用统计软件估计ARIMA模型

11.3.4 SQLServer2005中的时间序列分析

11.4 小结

11.5 习题

第12章 文本和Web挖掘

12.1 引例

12.2 文本挖掘

12.2.1 文本信息检索概述

12.2.2 基于关键字的关联分析

12.2.3 文档自动聚类

12.2.4 自动文档分类

12.2.5 自动摘要

12.3 Web挖掘

12.3.1 Web内容挖掘

12.3.2 Web结构挖掘

12.3.3 Web使用挖掘

12.4 小结

12.5 习题

参考文献

……[看更多目录]

序言随着计算机和信息时代的迅猛发展,人类收集、存储和访问数据的能力大大增强,快速增长的海量数据集已经远远超出了人类的理解能力,传统的数据分析工具也显得力不从心。如何不被这些海量数据淹没,而是有效地组织这些数据,并且从中找出有价值的知识,从而帮助人类制定正确的决策?针对这一问题,数据仓库和数据挖掘技术应运而生,并且显示出强大的生命力。要将海量数据转换成为有用的信息和知识,首先要有效地收集和组织数据。数据仓库是良好的数据收集和组织工具,它的任务是搜集来自各个业务系统的有用数据,存放在一个集成的储存区内。在数据仓库的丰富完整的数据基础上,数据挖掘技术可以从中挖掘出有价值的知识,从而帮助决策者做出正确决策。

本书主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。其中,前3章主要介绍数据仓库的基本原理和数据仓库系统的组建方法,后面的章节介绍当前流行的数据挖掘算法的主要思想和理论基础,并且给出丰富的应用实例。

本书紧跟数据仓库和数据挖掘技术的发展和人才培养的目标,有以下几个特点:

(1) 可读性强,文字叙述深入浅出,易读易用,即使是初学者,阅读起来也比较容易。

(2) 概念清晰,条理清楚,内容取舍合理。

(3) 本书强调基础,重视实例。各章节都以经典算法为主,介绍其主要思想和基本原理,并且给出恰当和丰富的实例。

(4) 书中实例和课后习题实用、丰富,通过练习,读者可以对各个知识点从不同角度得到训练,巩固和掌握所学知识。

(5) 教学资源丰富,本书提供多媒体教学课件和习题参考答案,方便教学。对于上述资源,读者可到清华大学出版社的网站http://www.tup.com.cn/下载。

(6) 对于数据仓库的组建方法和多数章节中的数据挖掘算法,本书都使用Microsoft SQL Server 2005进行了操作实现,这种做法与市场主流开发工具和技术同步,有利于读者走向社会。

本书各章节之间衔接自然,同时各章节又有一定的独立性,读者可按教材的自然顺序学习,也可以根据实际情况挑选需要的章节学习。

本书可以作为高等学校计算机及相关专业本科、研究生学习数据仓库和数据挖掘的教材,也可供相关领域的广大科技工作人员和高校师生参考。

本书由陈志泊担任主编,第1~第3章由聂耿青编写,第5、第6和第11章由韩慧编写,第4和第10章由孙俏编写,第7~第9和第12章由王建新编写。

由于时间仓促,加之编者水平有限,书中不足之处敬请批评指正。

文摘插图:

数据仓库与数据挖掘(普通高等教育“十一五”国家级规划教材)

(3)分区维。分区维以同一结构生成两个或多个维时,这些维结构相同,只是数值不同。例如,对于时间维,每一年都有相同的季度:相同的月和相同的天(除了闰年以外)。假定把度量事实表分割为2007年的数据和2008年的数据,那么在OLAP分析中将频繁使用时间分区维来分割数据仓库中的数据。其中一个时间维是针对2007年的数据,而另一个时间维针对2008年的数据。

(4)分类维。分类维是通过对一个维的属性值分组而创建的。例如,客户表中有家庭收入属性,如果希望查看客户根据收入的购物方式,就可以生成一个含有家庭收入的分类维。

(5)退化维。当维表中的主键在事实表中没有与外键关联时,这样的维称为退化维。退化维与事实表并无关系,但有时在查询限制条件(如订单号码、出货单编号等)中需要用到退化维。以销售分析为例,通常是把出货日期作为事实时间,而把订单日期或需求日期等作为查询条件,这里,订单日期或需求日期就是退化维。

(6)一致维。当有好几个数据集市要合并成一个企业级数据仓库时,可以使用一致维来集成数据集市,以便确保数据仓库可以使用每个数据集市的事实。

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有