分享
 
 
 

数据挖掘——理论与应用(高等学校计算机科学与技术教材)

数据挖掘——理论与应用(高等学校计算机科学与技术教材)  点此进入淘宝搜索页搜索
  特别声明:本站仅为商品信息简介,并不出售商品,您可点击文中链接进入淘宝网搜索页搜索该商品,有任何问题请与具体淘宝商家联系。
  參考價格: 点此进入淘宝搜索页搜索
  分類: 图书,计算机/网络,数据库,数据仓库与数据挖掘,

作者: 胡可云,田凤占,黄厚宽 编著

出 版 社:

出版时间: 2008-4-1字数: 399000版次: 1页数: 248印刷时间: 2008/04/01开本: 16开印次: 1纸张: 胶版纸I S B N : 9787811232523包装: 平装编辑推荐

原理与技术的完美结合,教学与科研的最新成果,语言精炼,实例丰富,可操作性强,实用性突出。

数据挖掘是一门面向应用的新兴学科分支,在过去的几年中,在许多领域的应用取得了成功。特别是在计算机应用起步较早、积累了大量数据的行业,如电信、银行、零售、科学研究等。当然,数据挖掘的应用范围远不止于此。数据挖掘的应用范围极其广泛,限制数据挖掘应用范围的只是可用的数据和人们的想像力。

虽然现在很多人都认识到了数据挖掘的作用,然而在实际的数据挖掘实践中,人们往往会陷入过分强调理论或轻视业务的误区。事实上,正确的数据挖掘过程和数据挖掘理论的运用对实践的数据挖掘项目的成功同等重要。本书编写的目的,是既完整地介绍数据挖掘常用的算法,又对数据挖掘的应用过程进行详细的介绍,使读者能够掌握整个数据挖掘过程的各个方面,从而更好地进行数据挖掘实践。

内容简介

本书从数据挖掘理论与数据挖掘应用过程两方面介绍了数据挖掘的最新成果。在理论部分,本书介绍了数据挖掘技术所涉及的基本概念、主流技术和最新成果;在应用部分,本书结合具体的实例系统论述了商业理解、数据预处理、建模、模型部署等整个数据挖掘流程。

本书既可以作为大学本科生和研究生的补充教材,也可以作为企业实施数据挖掘和商务智能的实战指导;既可以作为初次接触数据挖掘技术的入门读物,也可以作为高级研究人员的参考书。

目录

第1章 导论

1.1数据挖掘概述

1.1.1数据挖掘的背景

1.1.2数据挖掘的定义

1.1.3数据挖掘的应用

1.2数据挖掘的一般过程

1.2.1数据挖掘中的数据集

1.2.2数据挖掘的任务

1.2.3数据挖掘过程

1.3数据挖掘的一般方法

1.3.1 分类预测型方法

1.3.2 描述型方法

1.3.3 文本/Web挖掘方法

理论篇

第2章 分类方法

2.1 决策树

2.1.1 决策树基本概念

2.1.2 决策树构造过程

2.1.3 决策树的扩展

2.2 前馈神经网络

2.2.1 基本概念

2.2.2 BP训练过程

2.2.3 RBF网络

2.3 基于规则的方法

2.3.1 AQ算法

2.3.2 C45rules

2.3.3 RIPPER

2.4 支持向量机

2.4.1 核函数

2.4.2 线性可分模式下的最优超平面

2.4.3 线性不可分模式下的最优超平面

2.4.4 支持向量机

2.5贝叶斯分类

2.5.1贝叶斯理论和极大后验假设

2.5.2贝叶斯网络和贝叶斯分类器

2.5.3几种常见的贝叶斯分类器模型

2.5.4贝叶斯分类器应用举例

2.6粗糙集方法

2.6.1粗糙集概念

2.6.2粗糙集基本算法

2.6.3粗糙集方法的扩展

2.7 其他分类方法

2.7.1 回归分析

2.7.2 k-最近邻分类方法

2.7.3 组合学习方法

第3章聚类方法

3.1聚类方法概述

3.1.1聚类分析中的常见数据类型

3.1.2对聚类算法的一些典型要求

3.1.3主要的聚类方法

3.2划分聚类

3.2.1 k-均值算法

3.2.2 二分k-均值聚类方法

3.2.3 k-中心点算法

3.3 层次聚类

3.3.1 凝聚的和分裂的层次聚类

3.3.2 BIRCH算法

3.3.3 CuRE算法

3.3.4 ROCK算法

3.3.5 Chameleon

3.4 基于密度的聚类

3.4.1 DBSCAN算法

3.4.2 OPTICS算法

3.5 Kohonen聚类

3.5.1 自组织神经网络

3.5.2 Kohonen自组织映射

3.6 孤立点分析

3.6.1基于统计的孤立点检测

3.6.2基于距离的孤立点检测

3.6.3基于偏离的孤立点检测方法

3.7 概念格

3.7.1基本概念

3.7.2概念格的建造

3.7.3规则提取

第4章 关联分析

4.1基本概念与挖掘过程

4.1.1基本概念

4.1.2关联规则挖掘过程

4.2频繁项集挖掘算法

4.2.1 Apriori算法

4.2.2 Apriori算法的改进

4.2.3 FP_Growth算法

4.3关联规则生成算法

4.4频繁闭项集挖掘

4.5关联规则的扩展

4.5.1多层次关联规则

4.5.2多维关联规则

4.5.3定量关联规则

4.5.4加权关联规则

4.5.5序列模式分析

第5章 文本与Web挖掘

5.1文本挖掘

5.1.1文本预处理

5.1.2文本检索

5.1.3文本分类

5.1.4文本聚类

5.1.5文本摘要

5.2 Web挖掘

5.2.1 概述

5.2.2 Web内容挖掘

5.2.3 Web结构挖掘

5.2.4 Web使用挖掘

应用篇

第6章 业务理解

6.1需求分析

6.1.1需求分析的内容

6.1.2需求分析的方法

6.1.3需求分析的结果

6.1.4需求分析的注意事项

6.2实例:客户细分项目的需求分析

6.2.1客户细分项目的内容

6.2.2分析方法

6.2.3分析结果

第7章数据预处理

7.1数据理解

7.2数据准备

7.2.1数据整理与合并

7.2.2数据抽样

7.2.3训练集和测试集的划分方法

7.2.4类标签的确定

7.3数据描述

7.3.1单变量描述方法

7.3.2多变量描述方法

7.4数据清理

7.4.1缺值处理

7.4.2探测异常点与噪声清除

7.5变量变换与合成

7.5.1连续变量归一化

7.5.2离散变量的数值化

7.5.3连续变量离散化

7.5.4变量变换

7.5.5变量合成

7.6变量选择

7.6.1概述

7.6.2包装方法

7.6.3过滤方法

7.6.4主成分及因子分析

7.7 一些算法对预处理的要求

7.8 实例:客户流失项目的数据预处理

7.8.1数据理解和数据准备

7.8.2数据描述和清理

7.8.3数据变换与选择

第8章 建模

8.1 算法选择

8.2 模型参数调整

8.3 模型评估和性能比较

8.3.1 分类模型的评估方法

8.3.2 聚类模型的评估方法

8.4 模型导出

8.5 实例客户流失项目的建模

8.5.1 算法选择

8.5.2 参数调整

8.5.3 性能评估

8.5.4 模型导出

第9章 模型部署与维护

9.1 模型部署

9.2 模型维护

9.3 客户流失项目的模型部署与维护

附录A 主要数据挖掘软件简介

A1 SAS Enterprise Miner

A1.1 概述

A1.2 数据挖掘过程及模块

A2 SPSS Clementine

A2.1 概述

A2.2 数据挖掘过程及模块

A3 IBM Intelligent Miner

A3.1 概述

A3.2 数据挖掘过程及模块

A4 其他常见数据挖掘工具

参考文献

书摘插图

第6章 业务理解

数据挖掘过程并不是一个纯技术的过程,而是一个业务和技术相结合过程,或者说技术为业务服务的过程。片面地追求技术指标往往使得项目失败。数据挖掘算法相当于一个工具,如何使用这个工具非常重要。工具先进不见得就能得出好的项目结果,就如同有一架世界顶级的钢琴摆在面前,不是谁都能弹出最动听的曲子一样。而有些人则能在一架不起眼的钢琴上弹奏出优美的旋律。

在数据挖掘过程中,对业务的理解很大程度决定了最终结果的成败,在实际项目中,有很多这样的例子。例如,在一个预测移动用户流失的项目中,如果只是简单地追求预测的高准确率,而不考虑项目的目的是为了挽留这些用户,那么很可能的结果就是很高的预测准确率,但是在去找这些用户的时候,发现都已经无法联系了——模型确实很准确,找到了已流失的用户,但对客户来说毫无帮助。

因此,在启动一个数据挖掘过程时,首先要做的是对业务进行理解,确定客户的需求是什么,要达到什么样的业务目标;再根据客户的业务目标制定数据挖掘的目标;然后根据对目标的理解收集相关的数据和进行数据处理。

6.1 需求分析

需求分析的目的是熟悉相关业务,明确希望通过数据挖掘达到的业务目标。只有熟悉了相关业务,才能深刻地理解数据的含义,确定项目的范围,把业务问题正确地转换为定义良好的数据挖掘过程。

6.1.1 需求分析的内容

1. 相关业务

相关业务包括组织结构、业务流程及存在问题。数据挖掘系统需要能解决实际的业务问题,才能保证它的成功。需要确定谁是数据挖掘结果的最终用户,现有的业务流程是怎样的,存在一些什么问题,数据挖掘如何改进业务流程,要达到什么样的目标。

注意业务目标和数据挖掘目标是不同的。业务目标是从业务角度对数据挖掘过程要获得的目标的描述。例如,发现客户流失的模式,并利用该模式进行营销活动。数据挖掘目标是从数据挖掘角度对数据挖掘过程要获得的目标的描述。例如,以60%的准确率预测将要流失的客户。

在业务分析过程中,需要注意哪些因素对业务问题的影响是最重要的。在建模过程中,一组好的变量(代表关键因素)可能对模型的最终效果起决定性作用。

……

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
>>返回首頁<<
 
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有