汉语实词语法功能考察及词类体系构建

分類: 图书,社会科学,语言文字 ,
作者: 徐艳华 著
出 版 社: 中国社会科学出版社
出版时间: 2007-11-1字数:版次: 1页数: 163印刷时间:开本: 大32开印次:纸张:I S B N : 9787500465454包装: 平装内容简介
本书主要以计算机为服务对象,以语料库为信息源,采用统计并辅以内省的方法,详细考察了名词、动词、形容词和副词中高频的3514个词的语法功能,依据统计结果对这些词进行了分类,并从理论和实践两个方面对分类结果进行了验证。研究表明:从理论上来看,这种分类方法能够客观地反映现代汉语中词的多功能现象;在实践方面,该书的分类结果在外显式歧义结构的消解和基本名词短语的识别方面都起到了很好的作用。
作者简介
徐艳华,女,1976年生,山东烟台人,2003年获烟台师范学院文学硕士学位,2006年获南京师范大学文学博士学位,现为鲁东大学汉语言文学院讲师。主要从事现代汉语语法和计算语言学研究。先后发表学术论文多篇,参编词典三部,参加科研项目多项。
目录
中文摘要
Abstract
前言
第一章 现代汉语词类研究综述
第一节 词类研究及评价
第二节 现有的词类标记集及其优劣
第二章 句法功能信息库的构建与实现
第一节 句法功能统计的理论基础
第二节 收词的范围和原则
第三节 信息库属性的确立
第四节 语法功能统计的原则
第五节 句法功能信息库样例
第三章 现代汉语实词词类体系
第一节 词类的共性和个性以及词类的层级性
第二节 汉语实词词类层级体系
第四章 新旧词类体系的对比研究
第一节 三大类实词的句法功能
第二节 新旧体系句法功能复杂度的对比研究
第三节 新旧体系分类结果的对比研究
第四节 语料库方法与内省方法研究结果之比较
第五章 分类体系在外显式歧义结构消解中的应用
第一节 句法规则的形式化表达
第二节 短语结构歧义
第三节 v+v序列的识别方法
第四节 分类体系在v+v序列考察中的应用
第六章 分类体系在基本名词短语结构分析中的应用
第一节 基本名词短语及其识别方法
第二节 分类体系在v+n序列考察中的应用
第三节 句法关系歧义消解策略的设想
结语
一 本课题研究的主要工作
二 进一步的研究计划
参考文献
后记
书摘插图
第一章 现代汉语司类研究综述
第二节 现有的词类标记集及其优劣
任何自然语言的词汇都是一个很大的集合,一部中等规模的词典一般也有几万个词项。如果让计算机直接对这数量庞大的自然语言中的词语逐个进行分析是十分困难的,甚至难以实现。因而有必要对词汇进行抽象,对词汇进行分类。尽管在分类的依据方面各家都承认语法功能是词类划分的标准,但至于按照这个标准到底归为多少类,并无一定之规,因为根据抽象程度的不同可以有各种不同的结果。其实,最终分出的类的多少不是最本质的问题,既然划分词类是为句法分析服务的,那么我们最关心的当然是这个标记集究竟能不能实现其分类的目的,真正服务于自动句法分析呢?我们不妨从现有的常用词类标记集来寻求答案。
词类标记集是词类体系在词性标注器中的具体体现。评价一个词类标记集,不能简单地用“好”与“不好”来加以区分,而是要看实用不实用,具体说来要考虑如下一些原则:
(1)标准性:尽量采用当前已经成为各个语言的词性标准或正在成为词性标准的分类体系和标记符号,以保证研究工作与国内或国际的同类研究具有可比性,从而提高竞争力。
(2)区别性:既然采用的是按照句法功能的标准进行分类的词类体系,那么每一个词的词性标记要能够正确地反映它所具有的句法功能。
(3)必要性:在设立某个标记时,要考虑这个标记是否有用,有什么用。既然是为自动句法分析服务的,那么就应该首先考虑是否对自动句法分析有用。
(4)充分性:已有的标记能否满足各种标注或分析工作的需要。
(5)可行性:设立某个标记,要考虑计算机是否能自动标注出来。
(6)兼容性:尽量使标记集的表示与已经建立的各种资源的表示相一致或者相互可以转换,最好能兼容已有的影响较大的标记集。兼容性好,则有利于资源共享。
(7)可扩展性:充分考虑现有遗留问题在未来解决的可能性和未来技术发展对标记集的影响,以便在必要的时候加以扩充或修改,并使改动的工作量尽可能小。
……
