Regular Expression 正则表达式-1 (C#)

王朝c#·作者佚名  2006-01-09
窄屏简体版  字體: |||超大  

起因是因为一片帖子,问到了一个问题,帖子是这样的:

Originally Posted by 人就是这样

我想编一个程序,但学CompSci是很久以前的事情了。想请教请教大家。

有两个txt文件,一个叫source.txt(有很多数据), 一个叫target.txt(空白的)

我想把source.txt里的一些数据提取出来(稍微修改一下),然后写到target.txt里面。

举个例子:

sourse.txt里的数据:

2oi)4@##( "data:001%abc">dsi-23)(*32##("data:dce%xy3"#(*EOIj2308Eld

想提取的数据就是橘黄色的。

data:001%abc

全部提取出来以后,我还想把%换成*, 然后每条数据后面加个逗号","

最后target.txt就应该这样:

data:001*abc,

data:dce*xyz

请问应该怎么做啊?实在JAVA忘光了。求教~~

如果帮我做的话付点酬劳也可以。

以前我也面临过类似的问题,总是通过程序描述的办法解决,现在问题又提起来了,于是静下心来想一想。有了上学期330编译原理的基础,并且做过有限状态自动机以后,已经非常明确这种文字处理的事情应该交给Regular Expression(正则表达式),只不过自己总因为正则表达式晦涩难懂,因此没有好好的琢磨过。

于是我就打算借这个机会把Regular Expression好好的熟悉一下。结果发现程序原来如此好写:

using System;

using System.IO;

using System.Text;

using System.Text.RegularExpressions;

namespace RegExpression

{

/// <summary>

///

/// </summary>

public class DataFilter

{

public static void Main(string[] args)

{

if( args.Length < 2 )

{

Console.Error.WriteLine("Please enter 2 filenames(e.g. In.txt Out.txt)");

return;

}

string Result;

using( StreamReader sr = new StreamReader(args[0]) )

{

Result = Filter( sr.ReadToEnd() );

}

using( StreamWriter wr = new StreamWriter(args[1]) )

{

wr.Write(Result);

}

}

private static string Filter(string input)

{

StringBuilder result = new StringBuilder();

Regex r = new Regex("\"(?<data>\\w+):(?<key>\\w+)%(?<value>\\w+)\"", RegexOptions.Compiled);

for( Match m = r.Match(input); m.Success; m = m.NextMatch() )

{

result.Append( m.Result("${data}:${key}*${value},"+Environment.NewLine) );

}

return result.ToString();

}

}

}

实现这个功能的关键代码也就不超过10行就够了,一个字,爽。

略加修正:

·using statement

·end of line (Environment.NewLine)

·use StringBuilder to improve performence

这些要感谢cumcum给与指正。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航