最近做论坛filter,需要把一些明显的灌水帖子过滤,比如多个重复字符,这里我采用了正则表达式来过滤,程序如下:
3个以上认为重复
final static Pattern p = Pattern.compile("(.)\\1{3,}");
public static boolean containsRepeatChars(String txt){
Matcher m = p.matcher(txt);
if (m.find())
return true;
else
return false;
}
如上是静态方法,可以作为工具使用。重复字符数的指定可以在表达式指定。