数控挖掘技术应用实例
分類: 图书,工业技术,金属学与金属工艺,
作者: 纪希禹主编
出 版 社: 机械工业出版社
出版时间: 2009-4-1字数:版次: 1页数: 263印刷时间:开本: 16开印次:纸张:I S B N : 9787111264606包装: 平装编辑推荐
数据挖掘理论知识
数据挖掘操作方法
七大热门领域的实际应用
本书从理论、应用实例以及数据挖掘的发展趋势以及面临的机遇和挑战等几个方面,对数据挖掘技术进行了详细介绍。在应用实例部分分别介绍了数据挖掘技术在客户关系管理、市场营销、股票证券、电信领域、产品设计、军事研究以及Web挖掘等方面的应用。
内容简介
本书在介绍数据挖掘技术理论和算法的基础上,通过不同领域的应用案例,来说明数据挖掘在实际应用中的具体操作方法,以期为读者提供一个更为广阔的视角。本书从理论、应用实例和数据挖掘的发展趋势,以及面临的机遇和挑战等方面,对数据挖掘技术进行了详细介绍,其中在应用实例部分分别介绍了数据挖掘技术在客户关系管理、市场营销、证券领域、电信领域、产品设计、军事领域以及web数据挖掘等方面的应用。
本书可作为企事业单位信息管理部门以及其他各行各业的管理者、信息分析人员、数据统计人员、市场营销人员、研究与开发人员的参考资料,也可作为高等院校信息管理类、数据分析类、计算机类等相关专业的教材和参考书,还可作为高等院校毕业论文或毕业设计的参考资料。
目录
出版说明
前言
第1章绪论
1.1数据挖掘的基本概念
1.1.1啤酒与尿布
1.1.2什么是数据挖掘
1.1.3数据挖掘的分类
1.1.4数据挖掘的特点和功能
1.2数据挖掘的过程
1.2.1数据准备
1.2.2数据选择
1.2.3数据预处理
1.2.4数据挖掘及模式评价
1.3数据仓库和数据挖掘
1.3.1数据仓库的概念和特点
1.3.2数据集市
1.3.3元数据
1.3.4数据仓库和数据挖掘的关系
1.4OLAP和数据挖掘
1.4.1OLAP的基本概念
1.4.2OLAP的操作
1.4.3OLAP的类别
1.4.4OLAP和0LTP的关系
1.4.5OLAP和数据挖掘的关系
1.5数据挖掘的应用领域
1.6数据挖掘研究现状
1.6.1商业应用
1.6.2支持平台数据展现
1.6.3使用成本
1.6.4挖掘算法
1.7本章小结
第2章数据挖掘的常用技术
2.1 决策树
2.1.1决策树的基本概念
2.1.2决策树的基本原理
2.1.3决策树的算法
2.1.4决策树的优势和劣势
2.2神经网络
2.2.1神经网络的基本概念
2.2.2神经网络的特征
2.2.3神经网络的分类和学习方式
2.2.4进化计算
2.2.5神经网络的优缺点
2.3关联规则
2.3.1关联规则的基本概念
2.3.2经典Apriori算法的描述
2.3.3AprioriTid算法
2.3.4FP-tree算法
2.4聚类分析
2.4.1聚类分析的基本概念
2.4.2聚类算法简介
2.4.3孤立点分析
2.5统计学习
2.5.1统计分析综述
2.5.2贝叶斯学习
2.5.3支撑矢量机
2.5.4回归分析
2.6模糊集和粗糙集
2.6.1模糊集概述
2.6.2粗糙集概述
2.7本章小结
第3章数据挖掘在客户关系管理中的应用
3.1 数据挖掘在CRM中的应用现状
3.1.1CRM的由来
3.1.2CRM系统的研发现状
3.1.3数据挖掘在CRM中的使用情况
3.2数据挖掘在CIW中的应用
3.2.1客户群体分类
3.2.2客户盈利能力分析
3.2.3客户获取和客户保持
3.2.4客户满意度分析
3.3数据挖掘在通信公司CRM应用实例
3.3.1客户细分模型和挖掘算法选择
3.3.2数据挖掘模型和挖掘步骤
3.3.3结果分析和市场策略制定
3.4本章小结
第4章数据挖掘在市场营销中的应用
第5章数据挖掘在证券领域中的应用
第6章数据挖掘在电信领域中的应用
第7章数据挖掘在产品设计中的应用
第8章数据挖掘在军事领域中的应用
第9章Web数据挖掘
第10章数据挖掘技术的发展
参考文献
书摘插图
第2章数据挖掘的常用技术
2.1 决策树
决策树学习算法是对分类问题进行深入分析的一种方法。最早的决策树算法是在1960年由Hunt等人提出的概念学习系统框架方法(ConceptLearning System framework,CLS)。CLS算法可以说是决策树学习的奠基石,因为后来的许多决策树学习算法都是在这个算法的基础上发展起来的。20世纪70年代后期,Quinlan开创了用信息增益作为启发策略的ID3方法,从样本中学习构造专家系统。该算法在每寻个结点上使用信息熵的增益量作为启发式来选取厨陸作为扩展结点,将树展开。同时,Breiman和Friedman开发的CART(分类与回归树),方法类似于ID3,其在每个结点选择在统计意义上使分类误差最小的属性作为测试属性。后来又有大量的改进算法产生,如1993年Qumlan的改进决策树归纳包C4.5和后来的SEE5/C5.0系统,它们相对ID3各方面都更完善;允许递增式学习的ID4算法和无需重建决策树、只通过修改决策树来增加新的训练实例的ID5算法等。另外,在20世纪80年代后,各种决策树算法对噪声、连续属性、数据缺失、改善分割条件等也进行了研究。
2.1.1 决策树的基本概念
决策树,顾名思义,它的分析预测模型看上去像一棵树。树的根结点是一个数据集合空间,每个分支结点是一个分类问题,它是对一个单一属性的测试,该测试将数据集合空间分割成两个或更多块,每个叶结点是带有分类的数据分割。从决策树的根结点到叶结点的一条路径就形成了对相应对象的类别预测。决策树技术是用于数据挖掘领域中分类和预测的主要技术,它有如此重要作用的原因有三个:一是决策树构造的分类器易于理解,二是采用决策树分类,其速度快于其他分类方法,三是采用决策树的分类方法得到的分类准确性优于其他方法。
……