分享
 
 
 

Xalan-JavaXSLT处理器及其分割功能

王朝java/jsp·作者佚名  2008-05-19
窄屏简体版  字體: |||超大  

XML数据有各种各样的格式。然而,XML文档中的数据格式不一定符合目标系统的规范。XMLT模板常被采用来把一种格式转换为另一种格式。不幸的是,XSLT的方法仅仅提供一套有限的功能执行这些转换。

Apache软件基金的Xalan项目包括Java和C++两种版本的XSLT处理器。这个处理器提供解析XML文档的功能,并使用XSLT模板来转换它们。除了标准的XSLT转换以外,Xalan也提供一把扩展方法。在扩展库提供的这些方法中,有一个字符串tokenizer把字符串分割成一组token。

问题领域

精确的一组XML转换用tokenize方法。任何时候,当你需要把字符串以一致的样式分解为子串,可以采用tokenize方法。实际上,tokenize方法是一个XSLT方法,它带两个参数。第一个参数指定要被分割的字符串。第二个参数指定把字符串分解为一组字符串token的分隔符。

tokenize方法的结果是一组表示token的节点。这些token和节点可以使用iterator或者作为单个值来处理。你可以用tokenizer把字符串分解为一组单个值,从一个长字符串获取单个token。

例子

为了举例说明tokenize方法的用法,我们看一个使用它的例子。下面是包含需要我们分割的字符串的一个XML文档:

<CustomerAddress

<Address19399 W Higgins Street</Address1

<Address2Rosemont, IL 60018</Address2

</CustomerAddress

这个例子演示了系统的一个客户地址记录,包含两行地址。这是在系统中一个相当普遍的情形,地址信息仅当发邮件时使用,而实际的城市、州和邮编信息并不特别重要。不幸的是,许多系统希望地址信息被分成城市、州和邮编。需要一个机制把组合的<Address2元素分成单独的城市、州和邮编元素。

方案

为了把数据以恰当的格式提供给目标系统,我使用Xalan的tokenize扩展功能。这个方法基于一组分割符把一个字符串,比如像地址,分割成多个token。如果没有指定分割符,使用默认的空格符号作为分割符。在我们的例子中,使用的分割符包括空格符号和逗号。

我们从XSLT模板创建表格开始。下面是我们期待的经过转换得来的输出:

<CustomerAddress

<Address9399 W Higgins Street</Address

<CityRosemont</City

<StateIL</State

<Zip60018</Zip

</CustomerAddress

正当你看到的那样,我们想把<Address1元素转换成<Address元素,并把<Address2元素分割成<City、<State和<Zip元素。为使用tokenize方法,我们如下创建一个模板来调用它:

<?xml version="1.0" encoding="UTF-8"?

<xsl:stylesheet version="1.0"

xmlns:xsl="http://www.w3.org/1999/XSL/Transform"

xmlns:xalan="http://xml.apache.org/xalan"

<xsl:template match="/"

<xsl:for-each select="//CustomerAddress"

<Address<xsl:value-of select="Address1"/</Address

<City<xsl:value-of select="xalan:tokenize(Address2, ' ,')[1]"/</City

<State<xsl:value-of select="xalan:tokenize(Address2, ' ,')[2]"/</State

<Zip<xsl:value-of select="xalan:tokenize(Address2, ' ,')[3]"/</Zip

</xsl:for-each

</xsl:template

</xsl:stylesheet

有两个地方需要特别注意。第一个在<xsl:stylesheet元素里面。这里,我们定义了xalan名字空间。这个很重要,因为tokenize方法是xalan名字空间的一部分。如果没有恰当的名字空间定义,处理器不会知道xalan名字空间。

第二需要注意的是一组叫City, State和Zip的元素。对每一个这些元素,我们调用tokenize方法。tokenize方法总是返回一个nodeset。为了给这些元素提供单个值,必须给nodeset的单个节点赋值。为了做到这一点,我们给tokenize调用的前面添加一个索引(即,[1],[2],[3])。

这些索引指示出取出哪个token。City是地一个token,State是第二个token,Zip是第三个。

tokenize方法自身带有两个参数。第一个参数是我们分割的值(这个例子中是<Address2元素)。第二个参数是分隔符列表。我们使用包含在字符串‘ ,’――包含一个空格符号和一个逗号中的分隔符分割这个字符串。

在XML转换中分割字符串很普遍。为了无缝的处理这个问题,Apache XML项目和Xalan组已经添加了一个叫做tokenize的扩展方法来处理XML数据值的分割。访问Xalan网页,可以发现更多关于Xalan-Java XSLT处理器和tokenize方法的信息。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有