分享
 
 
 

用Lucene做一个简单的Java搜索工具

王朝java/jsp·作者佚名  2008-05-31
窄屏简体版  字體: |||超大  

初学LUCene,刚接触搜索引擎。知道了一点点,想做个小工具,实现根据“单词”搜索某个Java源文件。比如输入“String”去查询某些java源文件里用到了这个类。

这个想法的来源是,在以前刚学java时,有一本java基础教程的书的附带光盘里有作者写的一个程序,可以方便初学者查找某些类在哪个实例里出现。当时没有太在意,觉得作者的代码很长。所以现在想自己也写一个这样的小程序。

开发工具与运行环境:使用Lucene2.0的包,jdk1.5,在WindowsXP下运行。

思路分析与设计:

整个程序里,除了Lucene的必要操作外,就是IO的基本操作了。因为要对某目录下及其子目录下的所有Java源文件进行索引,就要用到递归,同时要过滤掉非Java源文件。根据这种情况,设计了以下5个类。

主类:索引类(IndexJavaFiles),搜索类(SearchJavaFiles)

异常类:索引异常类(IndexException),搜索异常类(SearchException)

还有一个文件过滤工厂类(FileFilterFactory)。

异常类不是必要的,特意设计来包装IO异常、文件异常和Lucene的异常。文件过滤工厂类的出现并不是故弄玄虚,只是不想太多代码集中一起,就把文件过虑器的设计放到一个类里。下面是程序的完整代码及注释。

IndexJavaFiles.java

/**

*indexthejavasourcefiles

*/

package powerwind;

import java.io.*;

import java.util.Date;

import org.apache.lucene.document.*;

import org.apache.lucene.index.IndexWriter;

/**

*@authorPowerwind

*@version1.0

*/

publicclass IndexJavaFiles {

/**

*默认构造方法

*/

public IndexJavaFiles() {

}

/**

* 这个私有递归方法由index方法调用,保证index传入的file是目录不是文件

*

*@paramwriter

*@paramfile

*@paramff

*@throwsIndexException

*/

privatevoid indexDirectory(IndexWriter writer, File file, FileFilter filter)throws IndexException {

if (file.isDirectory()) {

// 有选择地(过滤)获取目录下的文件和目录

File[] files = file.listFiles(filter);

// 非空目录

if (files != null) {

for (int i = 0; i < files.length; i++) {

indexDirectory(writer, files[i], filter);

}

}

} else {

try {

// 这里的file经过先前的过滤

writer.addDocument(parseFile(file));

System.out.println("增加文件: " + file);

} catch (IOException ioe) {

thrownew IndexException(ioe.getMessage());

}

}

}

/**

*传参数是文件就直接索引,若是目录则交给indexDirectory递归

*

*@paramwriter

*@paramfile

*@paramff

*@throwsIndexException

*/

publicvoid index(IndexWriter writer, File file, FileFilter filter) throws IndexException {

// 确定可读

if (file.exists() && file.canRead()) {

if (file.isDirectory()) {

indexDirectory(writer, file, filter);

} elseif (filter.accept(file)) {

try {

writer.addDocument(parseFile(file));

System.out.println("增加文件: " + file);

} catch (IOException ioe) {

thrownew IndexException(ioe.getMessage());

}

} else {

System.out.println("指定文件或目录错误,没有完成索引");

}

}

}

/**

*@paramfile

*

*把File变成Document

*/

private Document parseFile(File file) throws IndexException {

Document doc = new Document();

doc.add(new Field("path", file.getAbsolutePath(), Field.Store.YES,

Field.Index.UN_TOKENIZED));

try {

doc.add(new Field("contents", new FileReader(file)));

} catch (FileNotFoundException fnfe) {

thrownew IndexException(fnfe.getMessage());

}

return doc;

}

}

进入讨论组讨论。

index(IndexWriter writer, File file, FileFilter filter)调用私有方法indexDirectory(IndexWriter writer, File file, FileFilter filter)完成文件的索引。

下面是IndexException异常类。

IndexException.java

package powerwind;

publicclass IndexException extends Exception {

public IndexException(String message) {

super("Throw IndexException while indexing files: " + message);

}

}

下面是FileFilterFactory类,返回一个特定的文件过滤器(FileFilter)。

FileFilterFactory.java

package powerwind;

import java.io.*;

publicclass FileFilterFactory {

/**

*静态匿名内部类

*/

privatestatic FileFilter filter = new FileFilter() {

publicboolean accept(File file) {

long len;

return file.isDirectory()

(file.getName().endsWith(".java") &&

((len = file.length()) > 0) && len < 1024 * 1024);

}

};

publicstatic FileFilter getFilter() {

returnfilter;

}

}

main方法

/**

* main方法

*/

publicstaticvoid main(String[] args) throws Exception {

IndexJavaFiles ijf = new IndexJavaFiles();

Date start = new Date();

try {

IndexWriter writer = IndexWriterFactory.newInstance().createWriter("./index", true);

System.out.println("Indexing ...");

ijf.index(writer, new File("."), FileFilterFactory.getFilter());

System.out.println("Optimizing...");

writer.optimize();

writer.close();

Date end = new Date();

System.out.println(end.getTime() - start.getTime() + " total milliseconds");

} catch (IOException e) {

System.out.println(" caught a " + e.getClass() + "\n with message: " + e.getMessage());

}

}

SearchJavaFiles.java

package powerwind;

import java.io.*;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.index.IndexReader;

import org.apache.lucene.queryParser.*;

import org.apache.lucene.search.*;

publicclass SearchJavaFiles {

private IndexSearcher searcher;

private QueryParser parser;

/**

*

*@paramsearcher

*/

public SearchJavaFiles(IndexSearcher searcher) {

this.searcher = searcher;

}

/**

*

*@paramfield

*@paramanalyzer

*/

publicvoid setParser(String field, Analyzer analyzer) {

setParser(new QueryParser(field, analyzer));

}

/**

*@paramparser

*/

publicvoid setParser(QueryParser parser) {

this.parser = parser;

}

/**

*

*@paramquery

*@returnHits

*@throwsSearchException

*/

public Hits serach(Query query) throws SearchException {

try {

returnsearcher.search(query);

} catch (IOException ioe) {

thrownew SearchException(ioe.getMessage());

}

}

/**

*

*@paramqueryString

*@returnHits

*@throwsSearchException

*/

public Hits serach(String queryString) throws SearchException {

if (parser == null)

thrownew SearchException("parser is null!");

try {

returnsearcher.search(parser.parse(queryString));

} catch (IOException ioe) {

thrownew SearchException(ioe.getMessage());

} catch (ParseException pe) {

thrownew SearchException(pe.getMessage());

}

}

/**

*

*输出hits的结果,从start开始到end,不包括end

*

*@paramhits

*@paramstart

*@paramend

*@throwsSearchException

*/

publicstatic Hits display(Hits hits, int start, int end) throws SearchException {

try {

while (start < end) {

Document doc = hits.doc(start);

String path = doc.get("path");

if (path != null) {

System.out.println((start + 1) + "- " + path);

} else {

System.out.println((start + 1) + "- " + "No such path");

}

start++;

}

} catch (IOException ioe) {

thrownew SearchException(ioe.getMessage());

}

return hits;

}

进入讨论组讨论。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有