商务智能与数据挖掘Microsoft SQL Server应用
分類: 图书,计算机/网络,数据库,数据仓库与数据挖掘,
作者: 谢邦昌主编
出 版 社: 机械工业出版社
出版时间: 2008-3-1字数:版次: 1页数: 342印刷时间: 2008/03/01开本: 16开印次: 1纸张: 胶版纸I S B N : 9787111232414包装: 平装编辑推荐
相对于其他数据库系统或数据挖掘软件,微软最新推出的数据库系统Microsoft SOL Server借助自带的数据挖掘功能,较好地平衡了企业商务智能方案的性能和价格,因而在业界迅速普及。针对业界实务上的需求,本书主要介绍了如下内容:
数据仓库、数据挖掘与商务智能之间的关系。
Microsoft SQL Server的整体架构、分析服务9ate告服务以及Microsoft SQL Server的整合服务gl:IDMX
语言。
9种数据挖掘模型:决策树、贝叶斯分类、聚类分析、时序聚类、线性回归、Logistic回归、神经网络、时间序列。
本书给出了丰富的精彩实例,主要包括:
利用聚类分析找出最具有投资价值的企业。
利用决策树模型分析游戏《三国志4》武将数据,找出三国武将特性分布。
利用线性回归分析了解成人血液中的胆固醇是否受体重、血压及年龄的影响,了解来店顾客人数是否受广告促销费用、店面面积以及店铺所在位置的影响。
利用Logistic回归和神经网络分析影响病人肾细胞癌转移的临床病理因素。
利用Logistic回归分析影响高中学生升学的因素。
利用时间序列分析预测中国台湾地区未来的进出口货物价值,了解中国台湾地区未来的进出口货物的成长趋势,以及预测未来用电负荷,来整合整体电力使用规划。
本书涉及的数据文件可到华章网站(WWW.hzbook.com)和(WWW.acmr,com.cn/bi)下载。
内容简介
本书主要讨论数据挖掘技术的基本原理与应用,可以解决企业运营中遇到的各种问题,并介绍了SQLServer 2005处理这些问题的方法。内容主要包括数据仓库、数据挖掘中的主要方法,SQLServer2005中的商业智能与数据挖掘功能、决策树模型、聚类分析、神经网络模型和时间序列模型等,并配有相关的范例分析与实例练习。
本书内容翔实,示例丰富,结构合理,可作为各类开发人员及企业管理人员的参考用书。
作者简介
谢邦昌,台湾大学生物统计学博士。现任中华资料采矿协会(Chung-hua Data Mining Society,CDMS)理事长,辅仁大学统计资讯学系教授,华通人商用信息有限公司高级顾问。中国人民大学应用统计科学研究中心学术委员会委员。中国人民大学统计学系Data Minin9中心客座教授,上海财经大学统计学系客座教授。厦门大学计划统计学系客座教授。西南财经大学客座教授。
他是数据挖掘界领军人物及世界知名统计学家。发表过近三百篇关于统计和数据挖掘的论文。出版了近五十余本相关专著。
目录
推荐序
序
第1章 绪论
1.1 商业智能
1.2 数据挖掘
第2章 数据仓库
2.1 数据仓库定义
2.2 数据仓库特点
2.3 数据仓库架构
2.4 建立数据仓库的原因和目的
2.5 数据仓库的应用
2.6 数据仓库的管理
第3章 数据挖掘简介
3.1 数据挖掘的定义
3.2 数据挖掘的重要性
3.3 数据挖掘的功能
3.4 数据挖掘的步骤
3.5 数据挖掘建模的标准CRISP-DM
3.6 数据挖掘软件分类
3.7 各数据挖掘软件的分析方法简介
第4章 数据挖掘中的主要方法
4.1 回归分析
4.2 关联规则
4.3 聚类分析
4.4 判别分析
4.5 神经网络分析
4.6 决策树分析
4.7 其他分析方法
第5章 数据挖掘与相关领域的关系
5.1 数据挖掘与统计分析的不同
5.2 数据挖掘与数据仓库的关系
5.3 KDD与数据挖掘的关系
5.4 OLAP与数据挖掘的关系
5.5 数据挖掘与机器学习的关系
5.6 Web数据挖掘和数据挖掘有什么不同
第6章 SQL Server 2005中的商业智能
6.1 SQL Server 2005入门
6.2 关联型数据库
6.3 Analysis Services
第7章 SQL Server 2005中的数据挖掘功能
7.1 创建商业智能应用程序
7.2 SQL Server 2005数据挖掘功能的优势
7.3 SQL Server 2005数据挖掘算法
7.4 可扩展性
7.5 SQL Server 2005数据挖掘功能与商业智能集成
7.6 使用数据挖掘可以解决的问题
第8章 SQL Server 2005的分析服务
8.1 建立数据源与数据源视图
8.2 创建维度和多维数据集
8.3 构建和部署
8.4 从模板创建可自定义的数据库
8.5 统一维度模型
8.6 基于属性的维度
8.7 维度类型
8.8 量度组和透视
8.9 计算和分析
8.10 MDX脚本
8.11 存储过程
8.12 关键绩效指标
8.13 实时商业智能
第9章 SQL Server 2005的报表服务
第10章 决策树模型
第11章 贝叶斯分类
第12章 关联规则
第13章 聚类分析
第14章 时序聚类分析
第15章 线性回归模型
第16章 Logistic回归模型
第17章 神经网络模型
第18章 时间序列模型
第19章 SQL Server 2005整合服务
第20章 文本挖掘模型
第21章 SQL Server 2005的DMX语言
第22章 实际案例:聚类分析模型应用
第23章 实际案例:时间序列模型应用