机器学习导论
分類: 图书,计算机/网络,人工智能,
作者: (土)阿培丁著,范明等译
出 版 社: 机械工业出版社
出版时间: 2009-6-1字数:版次: 1页数: 272印刷时间:开本: 16开印次: 1纸张:I S B N : 9787111265245包装: 平装内容简介
机器学习的目标是对计算机编程,以便使用样本数据或以往的经验来解决给定的问题。已经有许多机器学习的成功应用,包括分析以往销售数据来预测客户行为,人脸识别或语音识别,优化机器人行为以便使用最少的资源来完成任务,以及从生物信息数据中提取知识的各种系统。为了对机器学习问题和解进行统一的论述,本书讨论了机器学习在统计学、模式识别、神经网络。人工智能。信号处理、控制和数据挖掘等不同领域的应用。对所有学习算法都进行了解释,以便读者可以容易地将书中的公式转变为计算机程序。本书可作为高等院校计算机相关专业高年级本科生和研究生的教材,也可供研究机器学习方法的技术人员参考。
本书对机器学习的定义和应用实例进行了介绍,涵盖了监督学习。贝叶斯决策理论。参数方法、多元方法、维度归约、聚类、非参数方法、决策树。线性判别式、多层感知器,局部模型、隐马尔可夫模型。分类算法评估和比较,组合多学习器以及增强学习等。
作者简介
Ethem Alpaydin,是土耳其伊斯坦布尔博阿齐奇大学计算机工程系的教授。于1990年在洛桑联邦理工学院获博士学位,之后先后在美国麻省理工和伯克利大学工作和进行博士后研究。Ethem博士主要从事机器学习方面的研究,是剑桥大学的《The Computer Journal》杂志编委和Elsevier的《Pattern Recognition》杂志的副主编。2001年和2002年,Ethem博士先后获得土耳其科学院青年科学家奖和土耳其科学与技术研究委员会科学奖。
目录
出版者的话
中文版序
译者序
前言
致谢
符号表
第1章 绪论
1.1什么是机器学习
1.2机器学习的应用实例
1.2.1学习关联性
1.2.2分类
1.2.3回归
1.2.4非监督学习
1.2.5增强学习
1.3注释
1.4相关资源
1.5习题
1.6参考文献
第2章 监督学习
2.1由实例学习类
2.2VC维
2.3概率逼近正确学习
2.4噪声
2.5学习多类
2.6回归
2.7模型选择与泛化
2.8监督机器学习算法的维
2.9注释
2.10习题
2.11参考文献
第3章 贝叶斯决策定理
3.1引言
3.2分类
3.3损失与风险
3.4判别式函数
3.5效用理论
3.6信息值
3.7贝叶斯网络
3.8影响图
3.9关联规则
3.10注释
3.11习题
3.12参考文献
第4章 参数方法
4.1引言
4.2最大似然估计
4.2.1伯努利密度
4.2.2多项密度
4.2.3高斯(正态)密度
4.3评价估计:偏倚和方差
4.4贝叶斯估计
4.5参数分类
4.6回归
4.7调整模型的复杂度:偏倚/方差两难选择
4.8模型选择过程
4.9注释
4.10习题
4.11参考文献
第5章 多元方法
5.1多元数据
5.2参数估计
5.3缺失值估计
5.4多元正态分布
5.5多元分类
……
第6章维度旭纳
第7章聚类
第8章非参数方法
第9章决策树
第10章线性判别式
第11章多层感知器
第12章局部模型
第13章隐马尔可夫模型
第14章分类算法评估和比较
第15章组合多学习器
第16章增强学习
书摘插图
第1章 绪论
1.1 什么是机器学习
随着计算机技术的发展,我们现在已经拥有存储和处理海量数据以及通过计算机网络从远程站点访问数据的能力。目前大多数的数据存取设备都是数字设备,记录的数据也很可靠。以一家连锁超市为例,它拥有遍布全国各地的数百家分店,并且在为数百万顾客提供数千种商品的零售服务。销售点的终端设备记录每笔交易的详细资料,包括日期、顾客识别码、购买商品和数量、消费总额等。这是典型的每日几个一字节的数据。只有分析这些数据,并且将它转换为可以利用的信息时,这些存储的数据才能变得有用,例如做预测。
我们不能确切地知道哪些人比较倾向于购买哪种特定的商品,也不知道应该向喜欢读海明威作品的人推荐哪位作者。如果我们知道,我们就不需要任何数据分析;我们只管供货并记录下编码就可以了。但是,正因为我们不知道,所以才只能收集数据,并期望从数据中提取这些问题或相似问题的答案。
我们确信存在某种过程,可以解释我们所观测到的数据。尽管我们不清楚数据产生过程(例如顾客行为)的细节,但是,我们知道数据产生不是完全随机的。人们并不是去超市随机购买商品。当人们买啤酒时,也会买薯片;夏天买冰淇淋,而冬天则为Gltthwein买香料。数据中存在确定的模式。
……