从属分析法
dependency analysis method
自动句法分析的一种方法,是1960年美国语言学家D.G.海斯根据机器翻译特点提出的。
20世纪50年代,法国语言学家L.特斯尼耶尔 (1893~1954) 提出从属关系语法。他认为,当词结合成句子时,词与词之间的关系不是这些词简单机械的组合,而是一个整体。句子以动词为中心,其他成分从属于动词,由动词支配。动词的从属成分有名词词组和副词词组两种。名词词组充当动词的行动元,副词词组充当动词的状态元。行动元的数目决定了动词的价。根据行动元的有无和多少,动词可分为零价动词、一价动词、二价动词和三价动词。从属关系语法在法国语言学界独树一帜,并在法国的机器翻译研究工作中得到了应用,成了从属分析法的先驱。
从属分析法的基本原则与从属关系语法是一致的,它力图从形式上建立句子中词与词之间的从属关系,并用图加以表示。如在英语中,冠词(Art)与名词(N)之间的关系是:名词是中心词,冠词是从属词,冠词位于名词的左侧,这种从属关系。
从属词写于中心词的下方,如从属词位于中心词的左侧,就写在左下方,如从属词位于中心词的右侧,就写在右下方。
这种从属关系还可用符号来表示。假定Xi为中心词;Xj1,Xj2,…,Xjk为Xi的左侧从属词(Xj1位于最左侧);Xjk+1,Xjk+2,…,Xjn为Xi的右侧从属词(Xjn位于最右侧);那么,表示Xi与其从属词间的语法规则可写为: Xi(Xj1,Xj2,…,Xjk,*,Xjk+1,Xjk+2,…,Xjn),式中*代表中心词相对于从属词的位置。
除了这种形式的规则之外,还有两种形式的规则:
①Xi (*):表示Xi在句中没有从属词,这是终极型规则;
②*(Xi):表示 Xi不是任何词的从属词,即Xi为全句的中心词,这是初始型规则。
采用这3种形式的规则,可以从形式上表示句子的中心词及其从属词之间的关系,以造出句子的从属关系树,从而表示出句子的句法结构,达到自动句法分析的目的。