DELPHI的通配符比较(第五版)

王朝delphi·作者佚名  2006-01-08
窄屏简体版  字體: |||超大  

DELPHI的通配符比较(第五版)

作者:李均宇

email: e271828@163.net 2003.1.5

我以前以为DELPHI中没有通配符的现成函数,后来找到了MatchesMask()。以前在未找到这个函数时我曾经在处于自由状态下尚有心情时便自已动手来作一个自定义的函数来实现这个功能。

程序的算法较复杂,先在子串的末尾加上‘?*’,再读取子串,查找子串中的通配符之间的字符,亦即子串中的子串,然后在源串中依次查找是否含有子串中的子串,不过实现起来还是费不少周折。这个函数实现了以下功能:

1。可能大多数情形下比递归算法和MatchesMask()速度高些;

2。实现了对星号和问号的所有情况下的正确比较;//这点也许仍需时间验证

3。支持中文;//星号和问号要在英文下的才有效

4。支持大小写敏感的选择。

注意子串的开头和末尾加不加上星号是有区别的。这个算法与用递归算法实现的函数在用栈上可能相似,但实际上是有一些不同的,对递归作了一些改进而成,可能在大多数情形下比递归过程要快一些,快多少难定。至少有这样的估计:当通配符比较仅仅作为查找子串用时,如源串为“1111111111”子串为“*11111112*”时,使用递归算法的时间复杂度是O(N*M),但我写的这个函数这时将简化成大约调用几次POS()函数的时间复杂度,也许可以将DELPHI中的POS()想象成"克努特--莫里斯---普拉特(KMP)算法"下的O(N+M)。少量下与递归算法的速度比较不明显。当源串为连续100个1,子串为连续99个1最后加上字符2下,通过在一个1000次的循环中测试,比递归算法要快几秒,比MatchesMask()函数快了二十几秒。我实际多次测试表明三者都有时成为最快,但是MatchesMask()似乎多些时候是比较慢,而递归的快慢变化较大,我写的函数可能在速度上比较平均。只不过我写的函数仅供参考用,出了问题我可是不任何负责的噢。

function isABClikeAX(const abc,ax:widestring):boolean; file://abc是源串,ax是子串

var

abcstart,axstart,abclength,axlength:integer;

endpartabc,endpartax,subax:widestring;

temp,abcwww,axwww:integer;

begin file://aaa

temp:=0;

abcstart:=1;

axstart:=1;

axwww:=1;

abcwww:=1;

abclength:=length(abc);

axlength:=length(ax);

isabclikeax:=true;

while axstart<=axlength do//源串长度大于或等于子串时

begin//bbb

if abcstart> abclength then

begin

if (ax[axlength]='*') and (axlength=axstart) then isabclikeax:=true

else isabclikeax:=false;//子串长过源串时

break;

end;

if ax[axstart]='?' then

begin

inc(axstart);

inc(abcstart);

continue;

end;

if ax[axstart]='*' then

begin

inc(axstart);

temp:=1;

axwww:=axstart;

abcwww:=abcstart;

continue;

end;

if not((ax[axstart]='?') or (ax[axstart]='*') ) then

begin//ccc

endpartax:=copy(ax,axstart,axlength-axstart+1)+'?*';

subax:=copy(endpartax,1,min(pos('?',endpartax),pos('*',endpartax))-1);

axstart:=axstart+min(pos('?',endpartax),pos('*',endpartax))-1;

endpartabc:=copy(abc,abcstart,abclength-abcstart+1);

if ((pos(subax,endpartabc)<>0) and (temp=1 )) or ((pos(subax,endpartabc)=1) and (temp=0)) then

begin//ddd

if temp=1 then temp:=0;

abcstart:=abcstart+(pos(subax,endpartabc)+length(subax)-1) ;

end//ddd

else//ddd

begin//ddd

if (temp=0) and (axwww>1) then

begin

axstart:=axwww;

abcwww:=abcwww+1;

abcstart:=abcwww;

temp:=1;

continue;

end;

isabclikeax:=false;

break;

end;//ddd

end;//ccc

end;//bbb

if (result) and (abcstart<=abclength) and (ax[axlength]<>'*') then isabclikeax:=false;//源串长过子串时

end;//aaa

FUNCTION IsLike(abc,ax:string):boolean; file://大小写敏感的函数

begin

islike:=isABClikeAX(abc,ax);

end;

FUNCTION WideCard(abc,ax:string):boolean; file://大小写不敏感的函数

begin

abc:=uppercase(abc);

ax:=uppercase(ax);

widecard:=isABClikeAX(abc,ax);

end;

注意USES MATH,因为用到MIN(),也可以用IF语句来代替MIN(),但不够明白。

多谢一些网友给我提出的一些正确的见解,使得修改有了正确的方向。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航