实验数据多元统计分析
分類: 图书,自然科学,数学,概率论与数理统计,
作者: 朱永生编著
出 版 社: 科学出版社
出版时间: 2009-2-1字数:版次: 1页数: 188印刷时间:开本: 16开印次:纸张:I S B N : 9787030236760包装: 平装内容简介
本书介绍实验或测量数据的多元统计分析方法,内容包括:贝叶斯决策、线性判别方法、决策树判别、人工神经网络、近邻法、概率密度估计量法、"矩阵判别、函数判别分析、支持向量机法等,以及不同判别方法的比较。此外,还简要介绍了将多种多元统计分析方法的计算机程序汇集在一起的程序包TMVA(toolkit for multivariate data analysis),并分析了粒子物理实验数据分析中应用多元统计分析方法的一些实例。
本书可供实验物理王作者和大专院校相关专业师生、理论物理研究人员、工程技术人员及从事自然科学和社会科学的数据测量和分析研究人员参考。
目录
前言
第一章 绪论
1.1模式和模式识别
1.2模式识别系统
1.2.1 原始数据获取
1.2.2 原始数据的预处理
1.2.3 特征提取和选择
1.2.4分类决策
1.3数据矩阵与样本空间
1.3.1 数据矩阵与样本空间
1.3,2 模式的相似性度量
1.3.3 样本点的权重和特征向量数据的预处理
1.4主成分分析
1.4.1 主成分分析的基本思想
1.4.2 主成分分析算法
1.4.3 降维处理及信息损失
第二章 贝叶斯决策
2.1 基于最小错误率的贝叶斯决策
2.1.1决策规则
2.1.2错误率
2.1.3 分类器设计
2.2 Neyman-Pearson决策
2.3 正态分布时的贝叶斯决策
2.4分类器的效率和错误率
2.4.1 分类器的效率、错误率和判选率矩阵
2.4.2 错误率的上界
2.4.3 利用检验样本集估计判选率矩阵和错误率
2.4.4 训练样本集和检验样本集的划分
2.4.5利用判选率矩阵估计各类“真实”样本数
2.4.6 分类器判定的“信号”样本中错判事例的扣除
2.5 讨论
第三章 线性判别方法
3.1线性判别函数
3.1.1 线性判别函数的基本概念
3.1.2 广义线性判别函数
3.1.3 线性分类器的设计
3.2Fisher线性判别
3.3感知准则函数
3.3.1 几个基本概念
3.3.2 感知准则函数
3.4最小错分样本数准则函数
3.5最小平方误差准则函数
3.5.1 平方误差准则函数及其MSE解
3.5.2 MSE准则函数的梯度下降算法
3.5.3 随机MSE准则函数及其随机逼近算法
3.6 多类问题
第四章 决策树判别
4.1超长方体分割法
4.1.1 超长方体分割法的基本思想
4.1.2 超长方体分割法中阐值的确定
4.1.3 超长方体分割法的优缺点及其改进
4.1.4 超长方体分割法用于高能物理实验分析
4.2 决策树法
4.2.1 决策树法的基本思想
4.2.2 信号/本底二元决策树的构建
4.2.3 决策树的修剪
4.3决策树林法
4.3.1 决策树林的构建
4.3.2 决策树林对输入事例的分类
4.3.3 重抽样法构建决策树林
第五章 人工神经网络
5.1 概述
5.1.1 生物神经元和人工神经元
5.1.2 人工神经网络的构成和学习规则
……
第六章近邻法
第七章其他非线性判别方法
第八章不同判别方法的比较
参考文献
书摘插图
第四章 决策树判别
前面我们讨论了用线性判别函数设计分类器的方法。但是大量实际的模式识别问题并不是线性可分的,比如当两类样本的分布具有多峰性质并相互交错时,简单的线性判别函数往往会导致较大的分类错误。这种情况下就需要采用非线性分类器。
从本章开始我们来讨论几种常用的、特别是在高能物理实验数据分析中常用的非线性分类方法。
4.1 超长方体分割法
我们首先讨论一种对于二类问题的最简单的非线性判别方法——超长方体分割法,它可以认为是决策树判别方法的一种最简单的特例,但是由于它简单、易实行的特点,在实验数据的多元分析中,特别是高能物理实验数据分析中,仍然有比较广泛的应用。
4.1.1 超长方体分割法的基本思想
在本节的讨论中,为了不失一般性,我们把样本分为信号和本底两个类别,信号指实验中所要研究的过程的事例样本,所有信号以外的样本都属于本底样本。
超长方体分割法不是企图用一个决策规则把两类样本一次分开,而是采用分级的方法来解决分类问题。它的基本思想如图4.1所示。……