高效办公"职通车"Excel 2007数据挖掘完全手册
分類: 图书,计算机/网络,家庭与办公室用书,微软Office ,
作者: 谢邦昌,朱建平,来升强 编著
出 版 社: 清华大学出版社
出版时间: 2008-7-1字数: 426000版次: 1页数: 295印刷时间: 2008/07/01开本: 16开印次: 1纸张: 胶版纸I S B N : 9787302174745包装: 平装编辑推荐
关键词,数据挖掘,Excel 软件应用。
系统性:详细叙述数据挖掘的一般概念、通行规范、方法技术以及软件应用等,使读者获得一个较为清晰和正确的数据挖掘观念。
具体性:围绕Excel 2007的数据模块,Excel 2007 强大的表格工具详加详解,有助于读者在工作表中完成种种复杂的数据分析任务。
实用性:提供一些大型应用案例,通过详细的操作讲解和结果解释,可令读者获得实际的数据挖掘经验,从而能迅速加以应用。
丛书特色:
软件与职业应用相结合,实用性强;每章都有实践案例,可直接借鉴,用于具体的实践工作之中以“基本知识点讲解——实践应用——常用问题解答”的逻辑结构编写,便于学习。
丛书定位:
适合作为行政办公、财务、统计、审计等领域在职工作人员提高自身业务水平的参考用书。
适合作为高校财务或经济管理等相关专业的教材或学习用书
适合作为各相关领域应用培训或职业的教学用书。
内容简介
本书围绕Excel 2007的数据挖掘模块,通过大量操作示范,介绍了主流的数据挖掘方法。全书包括数据挖掘算法介绍、Excel 2007数据挖掘模块介绍、其他分析工具介绍、数据挖掘范例4篇,共26章。除了给出有关的理论和原理阐述之外,还提供了一些大型应用案例。通过详细的操作讲解和结果分析,读者可以获得实际的数据挖掘经验,并能迅速地在自己所处的领域中加以应用。
利用Excel 2007的数据挖掘模块,读者无须经过专业培训,就能完成多种数据挖掘任务。本书适用于学习数据挖掘和相关课程的学生、运用Excel 2007进行复杂大型数据分析的职场人士及咨询公司从业人员等。
目录
第1篇 数据挖掘算法介绍
第1章 数据挖掘简介
1.1 数据挖掘的定义
1.2 数据挖掘的重要性
1.3 数据挖掘的功能
1.4 数据挖掘的步骤
1.5 数据挖掘建模的标准CRISP-DM
第2章 数据挖掘运用的理论和技术
2.1 回归分析
2.1.1 简单线性回归分析
2.1.2 多元回归分析
2.1.3 岭回归分析
2.1.4 Logistic回归分析
2.2 关联规则
2.3 聚类分析
2.4 判别分析
2.5 类神经网络分析
2.6 决策树分析
2.7 其他分析方法
第3章 数据挖掘与相关领域的关系
3.1 数据挖掘与统计分析的不同
3.2 数据挖掘与数据仓储的关系
3.3 知识发现与数据挖掘的关系
3.4 OLAP与数据挖掘的关系
3.5 数据挖掘与机器学习的关系
3.6 网络挖掘与数据挖掘的关系
第4章 数据挖掘商业软件产品及其应用现状
4.1 数据挖掘商业软件的分类
4.2 主要软件的介绍
4.3 顾客关系管理
4.4 数据挖掘的行业应用
第2篇 Excel 2007数据挖掘模块介绍
第5章 安装与设定Excel 2007数据挖掘加载项
5.1 系统需求
5.2 开始安装
5.3 完成安装验证
5.4 组件设定
5.5 配置完成检查
第6章 Excel 2007数据挖掘入门
6.1 Excel 2007数据挖掘功能介绍
6.2 数据挖掘使用说明
6.2.1 目录查询
6.2.2 开始功能
6.2.3 视频和教学
6.3 数据挖掘连接配置
6.3.1 设定目前的连接
6.3.2 跟踪
6.4 数据准备
6.4.1 浏览数据
6.4.2 清除数据
6.4.3 分割数据
6.5 数据建模
6.6 精确度和验证
6.6.1 准确性图表
6.6.2 分类矩阵
6.6.3 利润图
6.7 模型用法
6.7.1 浏览功能
6.7.2 查询功能
6.8 模型管理
6.8.1 重新命名挖掘模型
6.8.2 删除挖掘结构
6.8.3 清除挖掘结构
6.8.4 用原始数据处理挖掘结构
6.8.5 用新数据处理挖掘结构
6.8.6 导出挖掘结构
6.8.7 导入挖掘结构
第7章 决策树
7.1 基本概念
7.2 决策树模块的建立
7.3 决策树与判别函数比较
7.4 计算方法
7.4.1 确定预测精度的标准
7.4.2 选择分裂(分层)技术
7.4.3 定义停止分裂(分层)的时间点
7.4.4 选择适当大小的决策树
7.5 Excel 2007 决策树算法
第8章 贝叶斯概率分类
8.1 基本概念
8.2 Excel 2007贝叶斯概率分类
第9章 关联规则
9.1 基本概念
9.2 关联规则的种类
9.3 关联规则的算法:Apriori算法
9.4 Excel 2007关联规则
第10章 聚类分析
10.1 基本概念
10.2 层次聚类分析
10.3 聚类分析原理
10.4 Excel 2007聚类分析
第11章 时序聚类
11.1 基本概念
11.2 相关研究和算法
11.3 Excel 2007时序聚类
第12章 线性回归
12.1 基本概念
12.2 简单回归分析
12.3 多元回归分析
12.4 Excel 2007线性回归
第13章 Logistic回归
13.1 基本概念
13.2 logit变换
13.3 Logistic分布
13.4 列联表的Logistic回归模型
13.5 Excel 2007 Logistic回归
第14章 类神经网络
14.1 基本概念
14.2 类神经网络的架构与训练算法
14.3 类神经网络的特性
14.4 类神经网络应用
14.5 类神经网络优缺点
14.6 Excel 2007类神经网络
第15章 时间序列分析
15.1 基本概念
15.2 时间序列的成分
15.3 时间序列数据的图形介绍
15.4 利用平滑法预测
15.5 用趋势方程预测时间序列
15.6 预测含趋势与季节成分的时间序列
15.7 利用回归模型预测时间序列
15.8 其他预测模型
15.9 单变量时间序列预测模型
15.10 时间趋势预测模型
15.11 Excel 2007时间序列
第16章 DMX介绍
16.1 DMX介绍
16.2 DMX函数介绍
16.2.1 模型建立
16.2.2 模型训练
16.2.3 模型使用(预测)
16.2.4 其他函数语法
16.3 DMX数据挖掘语法
16.3.1 决策树
16.3.2 贝叶斯概率分类
16.3.3 关联规则
16.3.4 聚类分析
16.3.5 时序聚类
16.3.6 线性回归
16.3.7 Logistic回归
16.3.8 类神经网络
16.3.9 时间序列
16.4 DMX应用范例
16.4.1 分类
16.4.2 估计
16.4.3 预测
16.4.4 关联分组
16.4.5 聚类
第3篇 其他分析工具介绍
第17章 分析关键影响因素
第18章 检测类别
第19章 从示例填充
第20章 预测
第21章 突出显示异常值
第22章 应用场景分析
22.1 目标查找
22.2 假设
第23章 Visio 2007数据透视分析
第4篇 数据挖掘范例
第24章 上市公司投资价值分析的挖掘模型
24.1 研究动机与目的
24.2 挖掘模型的构建
24.3 变量筛选
24.4 决策树模型
24.5 贝叶斯概率模型
24.6 Logistic回归模型
24.7 预测准确度比较
第25章 信用卡用户信用评测的挖掘模型
25.1 研究背景
25.2 研究动机
25.3 研究目的
25.4 Excel 2007构建数据挖掘模型
25.4.1 决策树分析
25.4.2 聚类分析
25.4.3 Logistic回归
第26章 市场营销与客户细分的挖掘模型
26.1 研究动机与目的
26.2 研究方法与限制
26.3 数据分析
26.4 挖掘建模
26.4.1 决策树
26.4.2 单纯贝叶斯分类
26.4.3 聚类分析
26.4.4 决策树
26.4.5 Logistic回归
26.4.6 关联分析
26.5 结论
书摘插图
第1章 数据挖掘简介
1.1 数据挖掘的定义
Data mining is the process of seeking interesting or valuable information in large database.
数据挖掘(data mining)是近年来数据库应用领域中相当热门的话题。数据挖掘一般是指在数据库或数据仓库中,利用各种分析方法与技术,对过去累积的大量繁杂数据进行分析、归纳与整合等工作,提取出有用的信息,例如趋势(trend)、模式(pattem)及相关性(relationship)等,并将其中有价值的信息作为决策参考提供给决策者。通俗地说,数据挖掘就是从数据中发掘信息或知识,有人称为知识发现(knowledge discovery in database,KDD),也有人称为数据考古学(data archeology)、数据模式分析(data pattern analysis)或功能相依分析(functional dependency analysis)。目前,数据挖掘已经成为数据库系统、机器学习、统计方法等多个学科相互交叉的重要领域,而在实务界,越来越多的企业开始认识到,实施数据挖掘可以为企业带来更多潜在的商业机会。
但我们对数据挖掘应有一个正确的认知:数据挖掘不是一个无所不能的魔法。数据挖掘的种种工具都是从数据中发掘出各种可能成立的“预言”,并对其潜在价值加以“估计”,但数据挖掘本身并不能在实际中查证和确认这些假设,也不能判断这些假设的实际价值。
1.2 数据挖掘的重要性
现代企业经常会搜集大量的数据,这些数据涵盖了市场、客户、供货商,及其竞争对手等重要信息,但是由于信息超载与无结构化,企业的决策者无法充分利用这些庞大的数据资源,仅能使用其中的一小部分,这可能导致决策失误,甚至出现决策错误。而借助数据挖掘技术,企业完全有能力从浩瀚的数据海洋中,挖掘出全面而又有价值的信息和知识,并作为决策支持之用,进而形成企业独有的竞争优势。
……