分享
 
 
 

Lucene分析与应用

Lucene分析与应用  点此进入淘宝搜索页搜索
  特别声明:本站仅为商品信息简介,并不出售商品,您可点击文中链接进入淘宝网搜索页搜索该商品,有任何问题请与具体淘宝商家联系。
  參考價格: 点此进入淘宝搜索页搜索
  分類: 图书,计算机/网络,程序设计,其他,

作者: 吴众欣,沈家立编著

出 版 社: 机械工业出版社

出版时间: 2008-9-1字数:版次: 1页数: 279印刷时间: 2008/09/01开本: 16开印次: 1纸张: 胶版纸I S B N : 9787111249924包装: 平装编辑推荐

本书通过对Lucene源代码的解说、辅以图表,并用一些具体实例把所有源代码进行组织与剖析,完整地展示Lucene从建立索引到查询的过程。本书还通过介绍Lucene的应用,体验Lucene具体项目开发的应用环境。最后简单地介绍了Nutcl、和Hadoop。

本书尤其针对查询过程的算法分析道出了Lucene性能秘密,作者把Lucene开发者对查询性能的思考历程通过示例展示出来,将Lucene最精华的,最富有神秘色彩的代码剖析明白,这也是本书与其他Lucene书籍不同之处!

本书适用于搜索引擎技术研究人员、Lucene爱好者、对搜索引擎内核与运行机制感兴趣的读者阅读。

本书特色:详细解析源代码;完整展示工作过程;介绍具体项目开发的应用环境。

内容简介

本书对Lucene搜索引擎的源代码进行分析讲解,并用一些具体实例把所有源代码进行组织与剖析,完整地展示Lucene从建立索引到查询的过程。本书通过介绍Lucene的应用,分析Lucene具体项目开发的应用环境。最后简单地介绍了Nutch和Hadoop。

本书适用于开发搜索引擎的技术人员、Lucene爱好者等读者。

作者简介

吴众欣,西安交通大学在读博士,主攻搜索引擎与服务组合。喜欢研读,头脑虽慢,滴水石穿。好奇心重,兴趣广泛。

目录

前言

第1章 搜索引擎与Lucene

1.1 搜索引擎与Lucene简介

1.1.1 搜索引擎分类

1.1.2 Lucene项目简介

1.1.3 其他搜索引擎开发包介绍

1.2 Lucene的系统架构

1.2.1 Lucene最简示例

1.2.2 Lueene采用的索引结构

1.2.3 Lucene软件包架构

1.3 本书的章节导航

第2章 文档逻辑视图与文本分析

2.1 文档逻辑视图

2.2 Lucene的文本分析过程简介

2.3 空格解析器(WhitespaceAnalyzer)

2.3.1 空格分词器(Whitespace Tokenizer)

2.3.2 Token(标志)

2.4 标准解析器(StandardAnalyzer)

2.4.1 标准分词器(StandardTokenizer)

2.4.2 标准过滤器

2.5 打造自己的解析器

2.5.1 常用的中文分词法

2.5.2 对CJKAnalyzer的分析

2.5.3 构造自己的解析器

第3章 Lucene创建索引之一(段索引方式与倒排索引结构)

3.1 倒排结构与段索引方式

3.2 索引写入过程概述

第4章 Lucene创建索引之二(在内存中创建索引)

4.1 创建Document层面索引

4.2 写入field信息

4.3 文件倒排过程

4.4 填写postin,able

4.5 postingTable的排序过程

4.6 写入field名字文件(.fnm文件)

4.7 写入field信息文件(.fdt,.fdx文件)

4.8 写入频率与位置文件(.frq与.prx文件)

4.9 TermVector方式写入索引(.tvf,.tvd与.tvx文件)

4.10 字典文件(.tis与.tii文件)

4.11 写入规格化文件

第5章 Lucene创建索引之三(索引合并过程)

5.1 document层面的合并过程

5.2 field与term的合并过程

5.2.1 field信息合并过程

5.2.2 term信息合并过程

5.2.3 合并norm信息

5.3 Lunece索引采用的压缩算法

5.3.1 front coding(端部编码)

5.3.2 variable-byte coding(变长字节编码)

5.3.3 delta-coding或deha-encoding

5.4 小结

第6章 Lucene查询过程之一(查询模型与引擎预热)

6.1 查询模型

6.1.1 向量模型

6.1.2 布尔模型

6.1.3 Lucene的评分(score)方式

6.2 查询简单示例

6.3 引擎预热

6.3.1 获得并打开索引文件

6.3.2 获得segment信息

6.3.3 FSDirectory打开索引过程

6.3.4 获得field信息

6.3.5 获得term信息

第7章 Lucene查询过程之二(查询解析与语法)

7.1 构建查询解析器(QueryParser)

7.2 Lucene的查询语法

7.2.1 项(Tcrm)查询

7.2.2 域(Field)

7.2.3 词条查询(Term Modifiers)

7.2.4 布尔操作符(Boolean Operator)

7.2.5 组合查询(Grouping)

7.2.6 针对field的组合查询(Field Grouping Field)

7.2.7 Escaping Special Character(转义字符)

7.3 Lucene查询语法树的构建过程

7.3.1 过程分析

7.3.2 语法树分析实例

第8章 Lucene查询过程之三(相似度匹配与算法分析)

8.1 查询与相似度计算

8.1.1 查询器(Searcher)的查询过程

8.1.2 查询语句的权重计算

8.1.3 获得topK个document

8.2 Lncene查询算法分析

8.2.1 相似度计算简单实例

8.2.2 线性相似度计算

8.2.3 基于倒排索引的相似度计算

8.2.4 Lucene的相似度计算

第9章 Lucene标引与查询全程示例

9.1 实例描述

9.2建立索引过程

9.2.1 选择文档中建立索引的.field

9.2.2 选择field录入方式

9.2.3 生成segment文件

9.2.4 生成fields文件

9.2.5 posting文件

9.2.6 合并segment index生成index文件

9.2.7 合并后的文件关系

9.3 查询过程

第10章 Lucene的常用应用场景分析

10.1 对大型XML文档集合的检索

10.1.1 都柏林文件介绍

10.1.2 XML分析器介绍

10.1.3 Lucene在大型XML文件中的应用

10.2 MuhiSearcher的应用

10.2.1 MultiSearcher的应用

10.2.2 ParallelMuhiSearcher的应用

第11章 利用Lucene构建分布式搜索引擎

11.1 分布式文件系统和Hadoop

11.1.1 Hadoop文件系统体系结构

11.1.2 系统交互过程:单一NameNode方式

11.1.3 系统组件描述

11.2 Nutch简单剖析

11.3 体验Nutch

附录A TestIndexWriterMerging

附录B TestDocumentWriter与DocHelper

书摘插图

第1章 搜索引擎与Lucene

1.1 搜索引擎与Lucene简介

从最初的图书检索到链接查询,对图片、多媒体的搜索,直至现在的人肉搜索,搜索引擎作为信息融合平台将万千世界带到你的周围,让你触手可得,悄悄改变着你的生活,同时也可能将你暴露于众目睽睽之下。有心人可能会考虑它背后的机理,以体味搜索引擎给我们的生活带来的变化。

……

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
>>返回首頁<<
 
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有