DNA和蛋白质序列数据分析工具
分類: 图书,自然科学,生物科学,生物化学,
作者: 薛庆中等编著
出 版 社: 科学出版社
出版时间: 2009-1-1字数:版次: 1页数: 204印刷时间:开本: 16开印次: 1纸张:I S B N : 9787030226334包装: 平装编辑推荐
本书汇集了现代DNA和蛋白质序列分析内容精髓,对包括芯片数据、质谱数据处理和分析、系统生物学分析等各类数据分析工具进行扫描和重点介绍。对于这些内容,本书则通过较多使用网上在线工具配以详细的图文注释实现,同时写作上力求通俗渐进,有助于科研及教学人员,通过培训结合网络自学,掌握数据库搜索及其常用工具的操作方法,从中感悟DNA和蛋白质数据分析方法的要领。
内容简介
全书分9章。第1章,阐述序列比较的核心方法,即运用BLAST和ClustalX等工具做序列比对。第2章,重点介绍核苷酸序列分析工具,主要包括:基因可读框的识别,CpG岛、转录终止信号和启动子区域的预测分析,用mRNA序列预测基因等。第3章,介绍电子克隆的概念和具体操作方法。第4章,用MEGA4做分子进化遗传分析,绘制系统进化树,为研究基因进化打好基础。第5章,对蛋白质基本理化性质、二级结构、结构域和三维空间结构、预测目标蛋白的生物学功能等工具做逐一介绍。第6章,通过Gene Ontology和KEGG两个数据库,挖掘基因和蛋白质的功能并做代谢途径分析。第7章,利用X!Tandem软件鉴定蛋白质的串联质谱数据,进而预测蛋白质;同时借助TPP软件包进行蛋白质组学数据统计学分析,优化检索结果。第8章,使用TqVl4软件实现芯片的数据采集和标准化处理,并借助GenMAPP软件挖掘芯片数据的生物学意义。第9章,通过Cytoscape软件演示,介绍系统生物学分析概况,展示蛋白质-蛋白质相互作用,应用插件做网络结构分析。书后附有专业词中英文对照。
本书是为从事生物学、医学、农学及计算机科学等领域研究的研究生、大学生、教师、医生、研究人员、计算机工作人员提供的通俗易学的手册和工具。
目录
前言
第1章 序列比对工具BLAST和ClustalX的使用
1.1 序列比对BLAST
1.1.1 网上运行BLAST
1.1.2 本地运行BLAST(Windows系统)
1.2 多序列比对(ClustalX)
1.2.1 ClustalX的使用
1.2.2 数据的输入
1.2.3 数据的输出
主要参考文献
第2章 真核生物基因结构的预测分析
2.1 基因可读框的识别
2.2 CpG岛、转录终止信号和启动子区域的预测分析
2.2.1 CpG岛的预测分析
2.2.2 转录终止信号的预测分析
2.2.3 启动子区域的预测分析
2.3 采用.mR_NA序列预测基因Spidey的使用
2.4 ASTD数据库简介
主要参考文献
第3章 电子克隆
3.1 利用UniGene数据库进行电子延伸
3.1.1 目标序列的blastn检索
3.1.2 UniGene数据库检索
3.1.3 下载UniGene Cluster中所有EsT序列
3.2 从数据库中获取cDNA全长序列
3.3 本地序列拼接
3.3.1 CAP3序列拼接程序
3.3.2 Velvet序列拼接程序
3.4 基因的电子表达谱分析
3.5 核酸序列的电子基因定位分析
主要参考文献
第4章 分子进化遗传分析工具(MEGA 4)的使用
4.1 序列数据的获取和比对
4.1.1 数据库直接检索
4.1.2 BLAST比对
4.2 遗传距离的估计
4.3 分子钟假说的检验
4.4 多序列比对结果文件格式转换
4.5 系统进化树构建
4.5.1 进化树构建方法选择
4.5.2 进化树的树形选择
4.5.3 进化树的拓扑结构调整
4.5.4 进化树树枝形态的优化
4.5.5 进化树的保存
主要参考文献
第5章 蛋白质结构与功能预测
5.1 蛋白质一级结构分析
5.1.1 蛋白质理化性质分析
5.1.2 蛋白质亲疏水性分析
5.1.3 跨膜区结构预测
5.1.4 卷曲螺旋预测
5.2 蛋白质二级结构分析
5.2.1 PredictProtein
5.2.2 PSIPRED
5.3 蛋白质结构域与功能分析
5.3.1 Pfam(protein families database of alignment and HMM)
5.3.2 PROSITE
5.3.3 BLOCKS
5.3.4 SMART
5.4 蛋白质三维结构分析
5.4.1 同源建模(homology modeling)
5.4.2 线串法(threading)
5.4.3 从头预测(ab initio prediction)
5.4.4 蛋白质三维结构观察
主要参考文献
第6章 Gene Ont0Iogy数据库和KEGG数据库简介
6.1 Gene Ont010gy数据库
6.1.1 简介
6.1.2 用关键词检索GO数据库
6.1.3 用序列检索GO数据库
6.2 KEGG数据库
6.2.1 简介
6.2.2 根据代谢途径名称检索
6.2.3 根据基因名称检索
6.2.4 根据序列检索
主要参考文献
第7章 蛋白质组学数据分析
7.1 生物质谱技术介绍
7.1.1 质谱技术的基本原理
7.1.2 X!Tandem软件
7.1.3 Mascot软件
7.2 蛋白质组学数据统计分析软件
7.2.1 TPP简介
7.2.2 TPP的安装与配置
7.2.3 样本数据准备
7.2.4 将RAW文件转换成mzXML文件
7.2.5 由hmfl文件生成pepXML文件
7.2.6 运行PeptideProphet
7.2.7 运行ProteinProphet
7.2.8 数据的过滤筛选和将结果保存成Excel文件
主要参考文献
第8章 基因芯片数据处理和分析
8.1 芯片数据的获取和处理
8.1.1 芯片数据的格式转换
8.1.2 数据基本处理
8.2 芯片数据的检索和提交
8.2.1 芯片数据的文件格式
8.2.2 芯片数据的提交
8.3 芯片数据的可视化
8.3.1 GenMAPP的概念
8.3.2 GenMAPP的安装
8.3.3 GenMAPP的使用
8.4 芯片数据聚类分析
8.4.1 CLUSTER
8.4.2 TreeView
主要参考文献
第9章 系统生物学网络结构分析
9.1 Cytoscape软件简介
9.1.1 概况
9.1.2 主要功能
9.2 软件安装
9.3 Cytoscape基本操作
9.3.1 信息输入
9.3.2 插件安装
9.4 应用Cytoscape进行基因注释
9.4.1 BINGO插件的安装
9.4.2 使用实例
9.5 应用Cytoscape进行细胞定位
9.5.1 Cerebral插件的安装
9.5.2 使用实例
9.6 应用Cytoscape搜索基因相互作用文献
9.6.1 Agilent Literature Search插件安装
9.6.2 使用实例
9.7 应用Cytoscape做网络分析
9.7.1 将BOND网络数据库的信息输入Cytoscape
9.7.2 网络分析
主要参考文献
英汉对照词汇
索引
彩图
书摘插图
第1章 序列比对工具BLAST和ClustalX的使用
骆迎峰程尹薛庆中
本章主要介绍序列比对工具BLAST和ClustalX的概念和使用方法。通过输入序列从美国国家生物技术信息中心(NcBI)数据库中发现其相似的序列;进而通过不同物种多条相似序列的比较,预测基因的功能,探索物种的亲缘关系及其进化。
1.1 序列比对BLAST
BLAST是基本局部比对搜索工具(basic local alignment search t001)的缩写。它的功能是对生物不同蛋白质的氨基酸序列或不同基因的DNA序列进行比对。并从相应数据库中找到相同或相似序列。
NCBl提供了BLAST搜索的在线服务,用户提交核苷酸或蛋白质序列,并选择所要比较的NCBl序列数据库,BLAST搜索程序运行结束后会自动以网页形式返回结果,其中包括匹配的序列、相似性程度及显著性水平等信息。
NCBl还提供BLAST搜索程序和所有BLAST序列数据库的下载接口,用户下载相应软件后就可以在本地系统(Windows或者Unix)运行BLAST搜索。这样更有利于用户根据研究需要,整理出小型化且带有注释的自定义数据库,进行快速搜索,获得相似序列等信息。
……