分享
 
 
 

个性化搜索引擎原理与技术

个性化搜索引擎原理与技术  点此进入淘宝搜索页搜索
  特别声明:本站仅为商品信息简介,并不出售商品,您可点击文中链接进入淘宝网搜索页搜索该商品,有任何问题请与具体淘宝商家联系。
  參考價格: 点此进入淘宝搜索页搜索
  分類: 图书,社会科学,图书馆学 档案学 ,

作者: 李树青,韩忠愿 编著

出 版 社: 科学出版社

出版时间: 2008-6-1字数:版次: 1页数: 125印刷时间:开本: 16开印次:纸张:I S B N : 9787030222558包装: 平装编辑推荐

快速发展的现代互联网在带给人们大量信息的同时,也不可避免地产生了难以让用户快速获取有效信息的问题。作为一种常见的Web信息资源检索工具,搜索引擎13益受到人们的关注并得到广泛的使用。 本书共分为6章,第1章对相关技术和概念做了介绍,包括Web信息检索、Web挖掘和web个性化信息推荐服务等。第2章对网页权重分析技术从网页质量和网页相关度两个角度做出了说明。第3章对目前个性化搜索引擎的研究现状和相关概念进行了分析,也分析了这些技术所存在的主要问题。第4章主要比较了各种常见的用户模式识别方法。第5章提出了基于修改网页权重值的个性化PageRank算法和基于添加修正参数的个性化PageRank方法。第6章给出了一个较为完整的个性化搜索引擎系统原型,并对用户模式识别方法和PageRank方法的运行效果的测试。

内容简介

本书通过对基于个怀化信息推荐技术的搜索引擎服务器日志中所具有关键词序列得到用户模式,并按照事务模式聚类的方法实现用户个性化特征的表达,最后在搜索引擎的网页索引中,利用得到的用户个性化特征改进传统的PegeRank算法。通过上述工作,本书构建了一个完整的基于Web个性化信秘推荐技术的搜索引擎框架结构。

本书可作为计算机专业的本科生和研究生的参考用书,也可供有关技术人员参考。

目录

前言

第1章 绪论

1.1 Web信息检索

1.1.1 Web信息检索模型

1.1.2 向量空间模型

1.1.3 搜索引擎

1.1.4 搜索引擎工作原理

1.1.5 相关度排序技术

1.2 Web挖掘

1.2.1 Web挖掘的概念

1.2.2 Web挖掘的类型

1.2.3 Web挖掘的研究进展

1.3 web个性化信息推荐服务

1.3.1 概念

1.3.2 Web个性化信息推荐服务的种类划分

1.3.3 Web个性化信息推荐服务的发展

第2章 网页权重分析技术

2.1 网页质量分析技术

2.1.1 结合网页质量分析的Web信息检索模式

2.1.2 网页质量测度方法

2.2 网页相关度分析技术

2.2.1 标准PageRank算法

2.2.2 PageRank的优化计算

第3章 个性化搜索引擎

3.1 概念与特点

3.1.1 现代搜索引擎系统存在的问题

3.1.2 个性化搜索引擎的含义

3.1.3 现阶段个性化搜索引擎的不足

3.2 基本类型

3.2.1 基于个性化信息采集的个性化搜索引擎

3.2.2 基于查询改进的个性化搜索引擎

3.2.3 基于个性化网页权重的个性化搜索引擎

第4章 用户个性化模式的获取和表达

4.1 基于关键词序列的用户模式识别

4.1.1 概述

4.1.2 数据准备

4.1.3 用户识别

4.1.4 事务模式识别

4.2 基于用户事务模式聚类的Web信息个性化表达

4.2.1 用户事务模式的类别构造

4.2.2 基于频繁路径的用户事务模式类别构造

4.2.3 降维处理问题

第5章 基于关键词序列的个性化网页权重方法

5.1 方法概述

5.2 基于修改网页权重值的个性化PageRank

5.3 基于添加修正参数的个性化PageRank

5.3.1 使用事务聚类模式的个性化PageRank方法

5.3.2 使用主题化事务聚类模式的个性化PageRank方法

第6章 系统原型的实现

6.1 系统的开发方式

6.2 数据结构

6.3 存储过程

6.4 系统的功能模块

6.4.1 爬虫模块

6.4.2 Web网页分析模块

6.4.3 日志分析模块

6.4.4 用户接口模块

6.5 结果分析

6.5.1 关键词访问序列的获取情况

6.5.2 用户事务模式的获取情况

6.5.3 用户事务模式的聚类情况

6.5.4 个性化PageRank值的计算情况

6.6 系统框架评价

参考文献

书摘插图

第1章绪论

本章主要介绍了与个性化搜索引擎相关的基本技术内容,主要包括Web信息检索、Web挖掘和Web个性化信息推荐服务等。

1.1Web信息检索

随着互联网技术的快速发展,网络信息资源呈现一种爆炸式的增长态势,比如在2005年,Google搜索引擎能够遍历到的Web网页数量就已经达到近60亿。这些网络信息资源在给人们带来丰富知识和极大便利的同时,也暴露出一些亟待解决的问题。其中,最主要的问题表现在这种信息资源的增长速度远远超出了人们能够处理它们的能力,动辄千万吉的信息量让用户实际上难以获取所需的有效信息,更难以对收集来的海量信息进行分析和获取知识。奈斯比特在《大趋势》一书中准确形容了人们目前所处的困境,即信息是丰富的,而知识是贫乏的。

针对上述特点,人们在传统信息检索系统的基础上开发出新的Web信息检索系统,典型的系统就是搜索引擎。自从1994年问世以来,搜索引擎逐渐成为人们获取网络信息资源的主要方式,相关搜索引擎网站也是Web用户使用网络时首选的访问站点。另外,它和免费电子邮箱、网络实时通信软件构成了当今门户网站用来吸引用户访问的三种主要方式。现在,相关搜索引擎厂商日益成为促进互联网产业发展的重要力量。

1.1.1Web信息检索模型

广义的信息检索是指信息用户为处理和解决各种问题而查找、识别、获取相关的事实、数据、文献的活动及过程,而狭义的信息检索主要是指信息用户在计算机信息检索系统上进行的信息查询行为。具体的计算机检索行为包含脱机批处理检索、联机检索、光盘检索和网络化联机检索。Web信息检索是一种网络化的联机检索,它的检索对象就是互联网上的Web资源。

……

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
>>返回首頁<<
 
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有