统计学习基础:数据挖掘、推理与预测(国外计算机科学教材系列)(The Elements of Statistical Learning Data Mining,Inference,and Prediction)
分類: 图书,社会科学,统计学,统计方法,
品牌: 黑斯蒂
基本信息·出版社:电子工业出版社
·页码:381 页
·出版日期:2004年
·ISBN:7505393316
·条形码:9787505393318
·包装版本:1版
·装帧:平装
·开本:16
·正文语种:中文
·丛书名:国外计算机科学教材系列
·外文书名:The Elements of Statistical Learning Data Mining,Inference,and Prediction
产品信息有问题吗?请帮我们更新产品信息。
内容简介《统计学习基础:数据挖掘、推理与预测》介绍了这些领域的一些重要概念。尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩图。《统计学习基础:数据挖掘、推理与预测》内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得最全面的。计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。许多工具都具有共同的基础,但常常用不同的术语来表达。
作者简介Trevor Hastie,Robert Tibshirani和Jerome Friedman都是斯坦福大学统计学教授,并在这个领域做出了杰出的贡献。Hastie和Tibshirani提出了广义和加法模型,并出版专著“Generalized Additive Models”。Hastie的主要研究领域为:非参数回归和分类、统计计算以及生物信息学、医学和工业的特殊数据挖掘问题。他提出主曲线和主曲面的概念,并用S-PLUS编写了大量统计建模软件。Tibshirani的主要研究领域为:应用统计学、生物统计学和机器学习。他提出了套索的概念,还是“An Introduction to the Bootstrap”一书的作者之一。Friedman是CART、MARS和投影寻踪等数据挖掘工具的发明人之一。他不仅是位统计学家,而且是物理学家和计算机科学家,先后在物理学、计算机科学和统计学的一流杂志上表发论文80余篇。
编辑推荐随着计算机和信息时代的到来,统计问题的规模和复杂性都有了急剧增加。数据存储、组织和检索领域的挑战导致一个新领域“数据挖掘”的产生。数据挖掘是一个多学科交叉领域,涉及数据库技术、机器学习、统计学、神经网络、模式识别、知识库、信息提取、高性能计算等诸多领域,并在工业、商务、财经、通信、医疗卫生、生物工程、科学等众多行业得到了广泛的应用。 《统计学习基础:数据挖掘、推理与预测》试图将学习领域中许多重要的新思想汇集在一起,并且在统计学的框架下解释它们。
目录
第1章 绪论第2章 有指导学习概述2.1 引言2.2 变量类型和术语2.3 两种简单预测方法:最小二乘方和最近邻法2.4 统计判决理论2.5 高维空间的局部方法2.6 统计模型、有指导学习和函数逼近2.7 结构化回归模型2.8 受限的估计方法类2.9 模型选择和偏倚-方差权衡文献注释习题第3章 回归的线性方法3.1 引言3.2 线性回归模型和最小二乘方3.3 从简单的一元回归到多元回归3.4 子集选择和系数收缩3.5 计算考虑文献注释习题第4章 分类的线性方法4.1 引言4.2 指示矩阵的线性回归4.3 线性判别分析4.4 逻辑斯缔回归4.5 分离超平面文献注释习题第5章 基展开与正则化5.1 引言5.2 分段多项式和样条5.3 过滤和特征提取5.4 光滑样条5.5 光滑参数的自动选择5.6 无参逻辑斯缔回归5.7 多维样条函数5.8 正则化和再生核希尔伯特空间5.9 小波光滑文献注释习题第6章 核方法6.1 一维核光滑方法6.2 选择核的宽度6.3 IRp上的局部回归6.4 IRp上结构化局部回归模型6.5 局部似然和其他模型6.6 核密度估计和分类6.7 径向基函数和核6.8 密度估计和分类的混合模型6.9 计算考虑文献注释习题第7章 模型评估与选择7.1 引言7.2 偏倚、方差和模型复杂性7.3 偏倚-方差分解7.4 训练误差率的乐观性7.5 样本内预测误差的估计7.6 有效的参数个数7.7 贝叶斯方法和BIC7.8 最小描述长度7.9 Vapnik-Chernovenkis维7.10 交叉验证7.11 自助法文献注释习题第8章 模型推理和平均8.1 引言8.2 自助法和极大似然法8.3 贝叶斯方法8.4 自助法和贝叶斯推理之间的联系8.5 EM算法8.6 从后验中抽样的MCMC8.7 装袋8.8 模型平均和堆栈8.9 随机搜索:冲击文献注释习题第9章 加法模型、树和相关方法9.1 广义加法模型9.2 基于树的方法9.3 PRIM——凸点搜索9.4 MARS:多元自适应回归样条9.5 分层专家混合9.6 遗漏数据9.7 计算考虑文献注释习题第10章 提升和加法树10.1 提升方法10.2 提升拟合加法模型10.3 前向分步加法建模10.4 指数损失函数和AdaBoost10.5 为什么使用指数损失10.6 损失函数和健壮性10.7 数据挖掘的“现货”过程10.8 例:垃圾邮件数据10.9 提升树10.10 数值优化10.11 提升适当大小的树10.12 正则化10.13 可解释性10.14 实例文献注释习题第11章 神经网络11.1 引言11.2 投影寻踪回归11.3 神经网络11.4 拟合神经网络11.5 训练神经网络的一些问题11.6 例:模拟数据11.7 例:ZIP编码数据11.8 讨论11.9 计算考虑文献注释习题第12章 支持向量机和柔性判别12.1 引言12.2 支持向量分类器12.3 支持向量机12.4 线性判别分析的推广12.5 柔性判别分析12.6 罚判别分析12.7 混合判别分析12.8 计算考虑文献注释习题第13章 原型方法和最近邻13.1 引言13.2 原型方法13.3 K-最近邻分类器13.4 自适应的最近邻方法13.5 计算考虑文献注释习题第14章 无指导学习14.1 引言14.2 关联规则14.3 聚类分析14.4 自组织映射14.5 主成分、曲线和曲面14.6 独立成分分析和探测性投影寻踪14.7 多维定标文献注释习题术语表参考文献
……[看更多目录]
序言我们的书被范明教授、柴玉梅副教授和咎红英讲师翻译成中文,我们感到非常高兴。这意味我们的工作将有机会被更多人所了解——对于任何科学家,这都是令人期待和兴奋的。在斯坦福大学统计学系,我们有许多讲中文的研究生,他们使我们确信几位译者的翻译非.常出色。借此机会,我们向所有的中国同仁问好,并希望他们喜欢本书。热切期待我们的书在东方也能像在西方一样受到热烈欢迎。致以良好祝愿!
文摘插图: