以前一直用Java,对于XML的处理大多数时候都是直接使用JDK提供的标准DOM和SAX API,很少会去关心API背后的具体实现,个人而言比较偏爱Xerces,时间长了,习以为常,仅此而已。
如今用.NET,概叹XML技术的无处不在之外,还要花一点点时间去了解和适应.NET Framework提供的XML操纵API。.NET Framework提供的API也无他,无非就是DOM和SAX,只是在传统的SAX的基础上有所发展,弄出来一个什么使用“拉”技术的改良SAX,尝试了一下,确实要比传统的SAX要简单、灵活,不用再继承某一个稀奇古怪的什么类又实现什么让人伤脑筋的回调方法,只要弄一个while循环嵌一个switch结构就可以“只关心你所关心的节点类型和节点内容”。和DOM对应的类是XmlDocument及其派生类,和SAX对应的类是XmlReader及其派生类,例如常用的XmlTextReader。
前两天做一个小工具,作用是根据XML文件描述来批量生成一些烦冗复杂无聊透顶的C#代码,以前老师吹嘘XML的魔力的时候提到过“...甚至你可以用XML来实现一套你自己的语言...”云云,当时听着没当回事,现在想来还真的名不虚传(btw,其实类似的事情人家XDoclet老早就这么做了)。期间有个小想法,就是把一个杂乱无章的xml文本弄得漂漂亮亮的,再显示出来看着好舒服点,自然就想到了XML文档的格式化。
在Java领域里整理、美化一个XML文档是一件很easy的事情,有很多开源组件都可以出色地完成这个任务,不过在用.NET Framework API的时候着实让我苦恼了一下。当时查了半天的MSDN也就仅仅发现XmlTextWriter可以实现这个目的而已,而且XmlTextWriter还必须将内容输出到一个物理File或者是一个Stream(管你流到哪:),除非你手工拼凑字符串。但是我不想将之输出到任何内存之外的地方也不想拼凑无聊的字符串,于是又去翻System.IO命名空间,捣鼓了半天才发现一个MemoryStream(Java领域好像没有这种说法?),虽然是孤陋寡闻但是好歹也找对了。摆弄了一下,代码贴出,谁要参考的拿去吧,有好的批评建议可别吝啬要向我反馈。
private void btnShow_Click(object sender, System.EventArgs e)
{
string xmlfile = @"C:\tmp.xml";
MemoryStream mstream = new MemoryStream( 1024 );
XmlTextWriter writer = new XmlTextWriter( mstream, null );
XmlDocument xmldoc = new XmlDocument();
writer.Formatting = Formatting.Indented;
xmldoc.Load( xmlfile );
xmldoc.WriteTo( writer );
writer.Flush();
writer.Close();
Encoding encoding = Encoding.GetEncoding( "utf-8" );
this.rtxtResult.Text = encoding.GetString(mstream.ToArray());
mstream.Close();
}
注:这仅仅是示例代码,不适用于工业强度。
后记:当时是用RichTextBox来显示xml文本,虽然经过了格式化,但是看起来还是不舒服,后来干脆整了一个WebBrowser贴在Form上,直接去Navigate一个XML物理File,效果就跟用IE打开XML一样,缩进、高亮、折叠都有了,省心省力。。-_-#