| 導購 | 订阅 | 在线投稿
分享
 
 
 

故障解析:.NET開發正則表達式中BUG一例

來源:互聯網網民  2008-06-12 07:23:50  評論

又發現了一個 .net 的bug!最近在使用正則表達式的時候發現:在忽略大小寫的時候,匹配值從 0xff 到 0xffff 之間的所有字符,正則表達式竟然也能匹配兩個 ASCII 字符:i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和數字。

比如以下的代碼就是用來測試用正則表達式匹配從 0xff 到 0xffff 的字符。而值範圍在 0 到 0xfe 的所有字符是不能被匹配的。

1234567891011121314151617Regex regex = new Regex(@"[/u00FF-/uFFFF]+");

// The characters, whoes value are smaller than 0xff, are not expected to be matched.

for (int i = 0; i < 0xff; i++) {

string s = new string(new char[] { (char)i });

Debug.Assert(

!regex.IsMatch(s),

string.Format("The character was not expected to be matched: 0x{0:X}!", i));

}

// However, the characters whoes value are greater than 0xfe are expected to be matched.

for (int i = 0xff; i <= 0xffff; i++) {

string s = new string(new char[] { (char)i });

Debug.Assert(

regex.IsMatch(s),

string.Format("The character was expected to be matched: 0x{0:X}!", i));

}

這時的運行結果是正常的,沒有任何的斷言錯誤出現。

然而當使用忽略大小寫的匹配模式時,結果就不一樣了。將上面代碼中的第一行改成:

1Regex regex = new Regex(@"[/u00FF-/uFFFF]+", RegexOptions.IgnoreCase);

程序運行的時候就會有兩處斷言錯誤。它們分別是字符值爲 73 和 105,也就是小寫字母 i 和大寫字母 I。 這個 bug 非常奇怪,別的字符都很正常!而且用 javascript 腳本在 IE (版本是6.0)裏面運行也同樣有這麽 bug 存在(比如下面這段代碼)。然而在 Firefox 中運行就是沒有問題的。還是 Firefox 好啊,呵呵!

1234567891011121314151617var re = /[/u00FF-/uFFFF]+/;

// var re = /[/u00FF-/uFFFF]+/i;

for(var i=0; i<0xff; i++) {

var s = String.fromCharCode( i );

if ( re.test(s) ){

alert( 'Should not be matched: ' + i + '!' );

}

}

for(var i=0xff; i<=0xffff; i++) {

var s = String.fromCharCode( i );

if ( !re.test(s) ){

alert( 'Should be matched: ' + i + '!' );

}

}

 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
又發現了一個 .net 的bug!最近在使用正則表達式的時候發現:在忽略大小寫的時候,匹配值從 0xff 到 0xffff 之間的所有字符,正則表達式竟然也能匹配兩個 ASCII 字符:i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和數字。 比如以下的代碼就是用來測試用正則表達式匹配從 0xff 到 0xffff 的字符。而值範圍在 0 到 0xfe 的所有字符是不能被匹配的。   1234567891011121314151617Regex regex = new Regex(@"[/u00FF-/uFFFF]+");   // The characters, whoes value are smaller than 0xff, are not expected to be matched.   for (int i = 0; i < 0xff; i++) {   string s = new string(new char[] { (char)i });   Debug.Assert(   !regex.IsMatch(s),   string.Format("The character was not expected to be matched: 0x{0:X}!", i));   }   // However, the characters whoes value are greater than 0xfe are expected to be matched.   for (int i = 0xff; i <= 0xffff; i++) {   string s = new string(new char[] { (char)i });   Debug.Assert(   regex.IsMatch(s),   string.Format("The character was expected to be matched: 0x{0:X}!", i));   } 這時的運行結果是正常的,沒有任何的斷言錯誤出現。 然而當使用忽略大小寫的匹配模式時,結果就不一樣了。將上面代碼中的第一行改成: 1Regex regex = new Regex(@"[/u00FF-/uFFFF]+", RegexOptions.IgnoreCase); 程序運行的時候就會有兩處斷言錯誤。它們分別是字符值爲 73 和 105,也就是小寫字母 i 和大寫字母 I。 這個 bug 非常奇怪,別的字符都很正常!而且用 javascript 腳本在 IE (版本是6.0)裏面運行也同樣有這麽 bug 存在(比如下面這段代碼)。然而在 Firefox 中運行就是沒有問題的。還是 Firefox 好啊,呵呵! 1234567891011121314151617var re = /[/u00FF-/uFFFF]+/;   // var re = /[/u00FF-/uFFFF]+/i;   for(var i=0; i<0xff; i++) {   var s = String.fromCharCode( i );   if ( re.test(s) ){   alert( 'Should not be matched: ' + i + '!' );   }   }   for(var i=0xff; i<=0xffff; i++) {   var s = String.fromCharCode( i );   if ( !re.test(s) ){   alert( 'Should be matched: ' + i + '!' );   }   }
󰈣󰈤
王朝萬家燈火計劃
期待原創作者加盟
 
 
 
>>返回首頁<<
 
 
 
 
 
 熱帖排行
 
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有