Antlr入门详细教程 - 王朝网络宽屏版

一、 Antlr 的主要类：

Antlr 中有主要类有两种（其实还有一种 TreeLexer ）

Lexer：文法分析器类。主要用于把读入的字节流根据规则分段。既把长面条根据你要的尺寸切成一段一段：）并不对其作任何修改。

Parser：解析器类。主要用于处理经过 Lexer 处理后的各段。一些具体的操作都在这里。

二、 Antlr 文法文件形式：

Antlr 文件是 *.g 形式，即以 g 为后缀名。

例如： t.g

class P extends Parser；

startRule

： n：NAME

{System.out.println（"Hi there， "+n.getText（））；}

；

class L extends Lexer；

// one-or-more letters followed by a newline

NAME：（ 'a'……'z''A'……'Z' ）+ NEWLINE

；

NEWLINE

： '\r' '\n' // DOS

'\n' // UNIX

；

具体成分分析：

1 、总体结构

Class P extends Parser

Class L extends Lexer

两行同 Java 继续一样， P 继续 Parser 类； L 继续 Lexer 类。每个 .g 文件只能各有一个。

2 、 Lexer 类分析

一般按照

类型名：匹配的具体规则；

的形式构成。是分隔字节流的依据。同时可以看到里面可以互相引用。如本例中的类型名 NEWLINE 出现在 NEW 的匹配规则中。

3 、 Parser 类分析

一般按照

起始规则名：

规则实例名：类型名或规则名

{Java 语句……； }

；

……

的形式构成。

起始规则名：任意。

规则实例名：就象 Java 中“ String s ；”的 s 一样。规则实例名用于在之后的 JAVA 语句中调用。

类型名或规则名：可以是在 Lexer 中定义的类型名，也可以是 Parser 中定义的规则名。感觉就像是 int 与 Integer 的区别。

Java 语句：指当满足当前规则时所执行的语句。 Antlr 会自动嵌入生成的 java 类中。

三、生成 Java 类

1 、从 www.antlr.org 上下载 antlr-x.x.x.jar

2 、配置环境变量： classpath=.；x：\jdk\lib\tools.jar；x：\antlr-x.x.x.jar

3 、在 t.g 所在目录下执行：

java antlr.Tool t.g

会在当前目录下生成如下文件：

L.java ： Lexer 文法分析器 java 类。

P.java ： Parser 解析器 java 类。

PTokenTypes.java ： Lexer 中定义的类型具体化，供 Parser 解析器调用。

PTokenTypes.txt ：当外部的（如 t2.g ）要调用当前的类型或规则时要用到本文件。

四、执行

1 、编写 Main 类

import java.io.*；

class Main {

public static void main（String[] args） {

try {

L lexer = new L（new DataInputStream（System.in））；

P parser = new P（lexer）；

parser.startRule（）；

} catch（Exception e） {

System.err.println（"exception： "+e）；

}

2 、执行

c：\> javac *.java

c：\> java Main

Terence

Hi there， Terence

c：\>