分享
 
 
 

中文文本信息处理的原理与应用

王朝百科·作者佚名  2010-04-18
窄屏简体版  字體: |||超大  

作者:苗夺谦 卫志华

ISBN:10位[7302154988] 13位[9787302154983]

出版社:清华大学

出版日期:2007-09

定价:¥29.00 元

内容提要

本书是一本全面系统地介绍中文文本信息处理的教材,内容丰富,由浅入深地讲述了中文文本信息处理的原理与应用。本书不仅介绍了基于规则的自然语言分析方法,也介绍了基于统计学的方法。全书共分为四大部分,分别是词法分析、语法处理、语义分析和应用与技术。其中前三部分是自然语言处理的基本理论,第一部分针对中文处理中特有的分词问题,介绍了自动分词算法、分词中歧义的消除和未登录词的识别算法,另外还介绍了语料库的相关知识。第二部分和第三部分都是从语法(语义)的表示入手,将自然语言形式化,再给出语法(语义)分析的算法,并针对该过程中的歧义问题给出了一些成熟的解决方案。最后一部分讲述自然语言理解在信息检索、信息抽取、自动文摘和文本分类等领域的应用。本书思路清晰,在每部分及每章的开始都介绍了该部分知识与其他部分之间的关系,以及该部分的知识点之间的关系,以帮助读者从整体上把握中文文本信息处理的思路,并能根据不同的需求或不同的问题选择适当的算法。

本书涉及内容广泛,能满足不同水平读者群的需求,可以作为计算机、信息类高年级本科生的教材,也可作为自然语言处理方向研究生的教材,也非常适合作为自然语言处理应用领域的研究人员和技术人员的参考资料。

编辑推荐

本书是一本全面系统地介绍中文文本信息处理的教材,内容丰富,由浅入深地讲述了中文文本信息处理的原理与应用。本书不仅介绍了基于规则的自然语言分析方法,也介绍了基于统计学的方法。全书共分为四大部分,分别是词法分析、语法处理、语义分析和应用与技术。其中前三部分是自然语言处理的基本理论,第一部分针对中文处理中特有的分词问题,介绍了自动分词算法、分词中歧义的消除和未登录词的识别算法,另外还介绍了语料库的相关知识。第二部分和第三部分都是从语法(语义)的表示入手,将自然语言形式化,再给出语法(语义)分析的算法,并针对该过程中的歧义问题给出了一些成熟的解决方案。最后一部分讲述自然语言理解在信息检索、信息抽取、自动文摘和文本分类等领域的应用。本书思路清晰,在每部分及每章的开始都介绍了该部分知识与其他部分之间的关系,以及该部分的知识点之间的关系,以帮助读者从整体上把握中文文本信息处理的思路,并能根据不同的需求或不同的问题选择适当的算法。

本书涉及内容广泛,能满足不同水平读者群的需求,可以作为计算机、信息类高年级本科生的教材,也可作为自然语言处理方向研究生的教材,也非常适合作为自然语言处理应用领域的研究人员和技术人员的参考资料。

目录

第1章概论

1.1自然语言处理与中文信息处理

1.2自然语言处理的新趋势

1.3本书内容组织

第一部分词法分析

第2章自动分词

2.1关于自动分词

2.2分词词典

2.3机械分词方法

第3章分词歧义消解

3.1关于分词歧义

3.2基于规则的分词消歧

3.3基于统计方法的分词消歧

第4章未登录词获取

4.1关于未登录词

4.2基于统计学的未登录词获取方法

4.3中文姓名的自动辨识

4.4中文统计词汇获取

4.5无词典分词方法

第5章语料库的构建

5.1关于语料库

5.2汉语语料库的基本加工规范

5.3建设语料库的其他问题

第一部分习题

第二部分语法处理

第6章自动标注

6.1关于自动标注

6.2马尔可夫模型和隐马尔可夫模型

6.3马尔可夫模型标注器

6.4隐马尔可夫模型标注器

第7章语法表示

7.1关于语法表示

7.2形式语法描述

7.3短语结构语法

7.4转移网络

7.5短语结构与句法树

第8章语法分析

8.1关于语法分析

8.2基于符号串的句法分析

8.3自底向上的图句法分析

8.4自顶向下的图句法分析

8.5基于转移网络的句法分析

8.6移进归约句法分析器

8.7概率上下文无关文法分析

第二部分习题

第三部分语义分析

第9章语义表示

9.1关于语义表示

9.2语义的逻辑表示方法

9.3论旨角色

9.4语义网络表示法

9.5框架表示法

9.6量词的处理

第10章语义分析

10.1关于语义分析

10.2组合理论与语义解释

10.3基于语义特征的解释方法

10.4基于语法关系的语义分析

10.5语义语法

10.6模板匹配

10.7语义驱动的分析技术

第11章语义消歧

11.1关于语义歧义

11.2选择限制法消歧

11.3语义网络

11.4统计词义消歧

11.5统计语义优选

第三部分习题

第四部分应用与技术

第12章文本分类

12.1关于文本分类

12.2文本分类方法

12.3文本分类的评测

第13章信息检索

13.1关于信息检索

13.2基于统计学的信息检索模型

13.3基于语义的信息检索

13.4典型信息检索系统

13.5信息检索技术前沿

第14章信息抽取

14.1关于信息抽取

14.2半结构化文本的信息抽取技术

14.3典型信息抽取系统

14.4Web信息抽取

第15章自动文摘

15.1关于自动文摘

15.2自动文摘的方法

15.3自动文摘系统的评测

15.4自动文摘系统

第四部分习题

参考文献

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有