如何在java中去掉文本文件中的“”

王朝java/jsp·作者佚名  2008-05-19
窄屏简体版  字體: |||超大  

将word文档转换后有一个方形的全黑的符号,只有自己写一个filter才能过滤掉。把转换后的文档里面非中文的字符串过滤掉这个黑框即可。如何过滤? 根据byte值过滤就行了。看byte值是否相等。

注意,一定要先判断这个字符串是不是中文字符,是中文就不要进行过滤,否则,就会得出错误的结果。如何判断是不是中文字符? 根据该string第一个字节的byte值的范围。

但是有两点要注意:

1 因为可能是中英文混和,所以才要判断,你可以把一个String分成String.length()个string来看待。然后每个string判断它第一个字节值是多少。

2 黑框的byte值,你copy过去,然后new一个string,print出他的bytevalue就可以得到了。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航