2004年转眼就过去了,2005年在没有什么准备的情况下已悄然而至。还是好好总结一下过去这一年的经历、经验和教训吧。嗯,2004年还算不错,各方面都还行,年初的计划也基本或超额完成了,手头的几个软件项目也都顺利的发展中,并推出了数个Major Upgrades,客户的回馈也都令人满意,只是身体状况不太妙,似乎这一年中又老了一圈 :( 。
这些年一直热衷于C++程序,对什么网页设计一点都不在行,不管是中文页面,还是收“鬼子”美刀的“洋文”网站都显得单薄幼稚,多少有些损形象啊,所幸在2004年的大热天里,下了一番苦功夫,钻了一阵子CSS,终于将网站用notepad重新设计了一遍,看起来感觉好多了,当然只是个人的感觉,不知道用户是否认可。hoho
咦,不好,提起我的网站,突然想起来网站上所有静态页面上都写了一行 copyright notice ,象这样的:Copyright © 1998-2004 WJJ Software 如今已是2005年,看来又得逐个修改这一行了,:( , 真累呀,搞了半天,手都按酸了,还有100多个文件没有改完,看来得想想办法了。应该有这样的现成工具吧,google一把,找到不少,但不想逐个去试,怕染毒! 最好是有类似的脚本程序来处理,perl 应该不错吧,但不太熟悉,草草试了一下,没有成功,算了,干脆自己用C++做一个吧,谁让咱是C++程序员呢,还是C++亲切 :) ,三下五除二,就几行C++程序就搞定了,当然多亏有boost::regex帮忙,hoho。
现在来看看这个程序吧,进入main()第一件事就是提示一下使用方法,在DOS里这样键入命令:
type srcfn | regex.exe destfn
在Linux下改 type 为 cat 即可。
然后根据我的 copyright notice 行的内容做了一个正则表达式,象这样,
boost::regex expression("(.*)(Copyright)(.*)(2004)(.*)(WJJ)( +)(Software)(.*)");
写这么长的正则表达式也只是为了能精确匹配,简单的也可以是这样写:(.*)(2004)(.*) 但这可能会出问题,如果.html文件中有多处 2004 字样,这个表达式就会搞错位置了。
然后将匹配操作提交给 boost::regex_match() ;如果匹配成功,就将 what[4] 换成今年的 "2005",然后输出到 std::cout 即搞定。
当然为了用肉眼复查一下匹配结果,程序还将成功匹配的那一行和替换后的内容打印到 std::cerr,这样,如果有不正确的匹配,一眼便能看出。
#include
#include
#include "boost/regex.hpp"
int main(int argc, char* argv[])
{
{
std::cerr
std::cerr
std::cerr
std::cerr destfn " std::cerr destfn " std::cerr std::cerr }std::string src;char ch; while( std::cin.get(ch) ) src+=ch;//My copyright notice line looks as below,//Copyright © 1998-2004 WJJ Software. All rights reserved.boost::regex expression("(.*)(Copyright)(.*)(2004)(.*)(WJJ)( +)(Software)(.*)");boost::cmatch what;if(boost::regex_match(src, what, expression)){std::cout std::cerr std::cerr }else{std::cerr }//std::copy(what.begin()+1, what.end(), std::ostream_iterator(std::cerr,"/")); //for debug.argc;return 0;}用下面的命令编译这个程序 regex.cpp cl.exe -GX /Ic:\boost_1_32_0 regex.cpp where cl.exe is the VC++ compiler, c:\boost_1_32_0 is the subdirectory where the Boost resides.当然这个程序是依赖 STL 和 boost 库的,也都只用到一些基本的内容,比较简单。STL是C++标准库,Boost是即将加入STL的C++标准库。什么? 不会??? -------- 学!!!!关于Regular Expression,我也不甚懂,只会点皮毛,勉强够用吧。hoho编译完成后,用一个.html文件测试一下,输入命令:type links.html | regex.exe .\new\links.html打开产生的 .\new\links.html 一看,成功了。高兴中。。。可是还有百十来个这样的文件,难道说都要逐条键入? 那还不如手工改算了。 看来革命尚未成功,还得继续努力,那就再写一段cpp吧,其实也不必了,用.BAT好了。这百十个.html文件名,就通过 DIR *.html /on 命令打印到控制台上,然后标记/复制一下就可以粘贴到 .BAT文件中了。