有关jive论坛搜索中文化的支持详解!

王朝java/jsp·作者佚名  2006-01-09
窄屏简体版  字體: |||超大  

Jive的搜索借用了apche提供的lucene搜索引擎。lucene是一个纯Java的高性能的全文搜索引擎,你可以到apache的网站找到lucene的更多信息:

http://jakarta.apache.org/lucene/docs/index.html

但在Jive使用的lucene包中,并不支持中文搜索,本站的系统也是构建在Jive之上进行扩展,

中文搜索问题由JR管理系统主要开发人员之一cherami解决。很多关注Jive的朋友都来信向我们索取Jive中文搜索问题的解决方法,

我在这儿把我们的解决方法整理出来,希望能够给您提供帮助。

1. 下载lucene中文搜索支持包

将lucene_cn.jar放到您的lib目录下。

2:修改您的DbSearchManager.java

在com.jivesoftware.forum.database.DbSearchManager.java中,首先导入lucene中文包:

import org.apache.lucene.analysis.cn.*;

在DbSearchManager.java中找到如下代码:

/** * The analyzer governs how words are tokenized. The standard anaylyzer * does a decent job in most cases, but could be replaced under certain * circumstances. We make the analyzer protected so that the DbQuery class * can also reference it (indexing and searching should use the same * analyzer). */ protected static Analyzer analyzer = new StandardAnalyzer();

替换为:

protected static Analyzer analyzer = new ChineseAnalyzer();

3. 重启Jive,现在你的Jive即支持中文搜索了。

4. 其它问题

要使用中文搜索,您的搜索的jsp的页面也需要使用GB2312的编码方式:

<%@ page contentType="text/html; charset=GB2312" %>

在我们的实现中,还遇到一个问题。就是在搜索时,如果直接在search.jsp页面中使用可以正常,但如果是从另外一个页面的搜索框中跳转到search.jsp页面,则搜索输入框中的所有的中文字符都变成“?”了。这个问题是和平台有关的,引起原因很复杂。我的解决方法是在search.jsp中得到查询串时,可以参考使用:

java.net.URLEncoder.encode(queryText,"GB2312");

5:最后总结:

对于中文搜索还需要修改两个jsp页面:search.jsp以及post.jsp将其中的:

java.net.URLEncoder.encode(queryText)、

URLEncoder.encode(url.toString())、

java.net.URLEncoder.encode(postLink.toString())、

URLEncoder.encode(name)、

URLEncoder.encode(email)都在其encode()里面加入,"GBK"即可使你的jivc论坛完全支持中文化的搜索了。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航