分享
 
 
 

Learning Spirit

王朝other·作者佚名  2006-02-01
窄屏简体版  字體: |||超大  

spirit是boost中的语法分析框架。使用spirit可以用来编写语法分析程序。

spirit有如下特点:

l 使用递归下降分析程序(分析的效率不高)

l 模板元编程技术实现(编译慢,但是提高了程序的运行速度)

l EBNF语法表示(使用方便直观)

Hello, Spirit!下面我们就通过一个简单的例子,来看看spirit到底是怎么回事。

我们要做的是,分析类似于下面的一段文本:

1, 12,11 ,200,111

使用逗号分割的整数序列,然后求出它们的和。当然,这个程序不使用spirit能够更简单的完成,我们这里只是简单的举个例子,spirit不仅仅如此。

语法分析首先我们来分析一下这段文本的语法,使用EBNF表示如下:(EBNF-Extend Backus Naur Form,是用来表示文法的)

S::= integer (‘,’ integer)*

如果你没有学过编译原理,那么可能看不懂上面的式子。简单的说,意思就是一个整数,然后接着重复任意次数的逗号+整数。有点类似于正则表达式的语法。

在spirit的EBNF语法中,和这个有点不一样。首先,星号* 这个运算符必须前置,因为在c++中只有前置的星号来表示指针运算(当然,spirit重载的指针运算符,使它表示重复的意思)。然后,式子中不同的部分使用>>运算符连接,表示顺序。a>>b表示ab这样的语法。最后式子就是这样的:

s=integer>>*(‘,’>>integer)

当然上面的式子还不是最终的。

Parser在Spirit中,类似于上面的integer和’,’称为parser,parser使用来匹配文本的。

例如:int_p用来匹配一个十进制整数。也就是说,如果是用int_p来分析语法的话,”10”,”123”这样的字符串是符合语法的,而 “12ab” “//11” 是不符合语法的。

ch_p(c)用来匹配字符c,c可以是char或者wchar_t,例如:ch_p(‘,’)用来匹配一个逗号。

parser之间通过运算符的连接的结果也是一个parser。

例如:

ch_p(‘a’)>>ch_p(‘b’)匹配”ab”

ch_p(‘a’)>>*ch_(‘b’)匹配”a”,”ab”,”abb”,”abbb”,...

那么,逗号分割的整数序列的语法可以表示为:

s=int_p>>*(ch_p(‘,’)>>int_p);

有可能你会有疑问,在这里int_p和ch_p是什么?

int_p是一个类似于cout这样的已经预先定义好的对象,它的类型是int_parser<type,base,min,max>。

ch_p是一个函数,返回一个chlit<CharT>对象。

这些以后会说到。

最后,s的类型是什么,我们如何来定义它的类型?

s的类型一般为rule<>就可以了,rule<>是一个parser的容器,它可以保存任意类型的parser。当然rule<>本身也可以作为parser来是用。

例如:

rule<> s,t;

t=ch_(‘,’)>>int_p;

s=int_p>>*t;

这就相当于:

rule<> s= int_p>>*(ch_p(‘,’)>>int_p);

parse函数至此,我们已经使用spirit表示了语法,那么使用这个语法来分析字符串呢?

答案就是parse函数。语法如下:

parse(str , s , space_p);

这里str是一个c语言的0节尾字符串,s就是上面的rule<>。

space_p是一个parser,在这里作为skip parser,用来过滤掉空白字符(逗号和整数之间的空格等符号)。

parse也接受迭代器的输入,parse(first,last,s,space_p),first,last就是开始结束的迭代器。

parse返回的是parse_info<>对象,用来返回分析的结果(成功或失败)。

parse_info<>有4个成员:

stop 分析结束的位置

hit 是否成功匹配,即符合语法。

full 是否匹配所有的输入,即符合语法且没有剩余的字符没有匹配

length 匹配到的字符数

至此,我们可以写出程序了。

代码如下:

#include<iostream>

#include<string>

#include<boost/spirit.hpp>//spirit的头文件

using namespace std;

using namespace boost::spirit;

int main()

{

rule<phrase_scanner_t> s =int_p >> *(ch_p(',')>>int_p);

//下面的parse函数用到了space_p

//所以不能使用默认的模板参数现在不必关心这样的问题。

string str;

while(getline(cin,str))

{

parse_info<> info = parse(str.c_str(),s,space_p);

if (info.full)

{

cout<<"Parse successful."<<endl;

}

else

{

cout<<"Parse fail."<<endl;

}

}

return 0;

}

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有