分享
 
 
 

搜索引擎是如何工作的

王朝互联网·作者佚名  2011-12-16
窄屏简体版  字體: |||超大  

在我们踏入学习搜索引擎优化之前,也许我们最先想了解的是关于搜索引擎如何工作的问题?

当你初步的了解了搜索引擎工作的大概流程和机制,你学习seo的思路就会更加清晰。掌握seo技术也会更加迅速。

好了。废话不多说。

我们一起来看看搜索引擎到底是如何工作的吧?~~

我们这里就以google为例子吧。

其实搜索引擎的工作大概流程如下:

(按上图所示分左边右边来看搜索引擎是如何工作的)

看了上面的图片后其实基本我们都明白了。如果还不明白请继续看下文:

首先:是搜索者在搜索引擎上敲下了关键词。

比如:seo俱乐部

也就是上面图片中左上部分:

第一步,匹配搜索请求。据说他们会把用户输入进去的关键词,比如什么的seo俱乐部,称作“搜索项”。

用户一旦输入搜索项然后敲下了回车后,搜索引擎就开始分析搜索请求了-----检查搜索引擎请求的每个搜索项,并且将作一件令人很多seoer紧张的事情:把哪个网页放在第一位,第二位,第三位。。。

而哪些作为分析的依据可能不同的搜索引擎有所不同或者有所侧重。但这一步基本是一样的。

比如这期间会有(以下东西说起来就比较深奥和繁琐,不一一详细解说了):

发现词的变体和矫正拼写:查找词组,非词组和停止词(像英文里,同样一个量词,但是有复数和单数,搜索引擎会根据这些微末的信息做出不同的判断;比如输错字的情况怎么提供答案。你可以试试在搜索引擎里输入:“举乐部”,谷歌就会问你:“您是不是要找:俱乐部!”没错,“俱乐部”正才正是我要找的。

接着会进入上图的右边部分的工作,按匹配搜索请求到分析搜索请求的这个过程里,将会进行以下步骤的处理:

A:检查词组,非词组和停止词:

检查词组和非词组.就是说当搜索者输入搜索请求时,搜索引擎会进行分析判断后作出一种过滤.把一个短句中认为是非词组的给过滤掉,然后又判断哪些词组作为关键词进行搜索,最后按分析的各页面的最合适的页面排序显示出来.

比如当我们搜索”一种绿茶”,很可能” 一种”会被判定成非词组.

另外像一种,一张,一个,这些词,搜索引擎一般不会去搜索他们,被称之为”停词(stop word)”.对于中文来说,我们一般会去以这些词来命名于产品.所以几乎也没有把这些词作关键词来处理.但是,在英文肯就会出现比较多.比如”The limited”

B:检查词序:

比如我们搜索”网站优化”和”优化网站”时,得到的结果一般是不一样的,这是因为搜索引擎在排序时也会考虑到词序问题.

C:处理搜索运算符号

比如”+-”号.这里用英文打比喻比较好说.

我们搜索白宫.英文: “the white house”但是这样的话搜索引擎有可能把the作为停止词给省略了,这样就会显示一些我们不想要的信息来,比如关于描述白房子(white house)的信息.

因此我们可以这样来做精确搜索 +the white house,这样就可以确保显示在最前的都是关于白宫的信息页面.

再比如:我们想搜索seoclub (它是一个提供搜索引擎优化信息的网站),但是还有一个叫seoclub tv(它是一个讲搜索引擎优化的电视台),这个时候如果我们想省略掉搜索结果里面的关于这个电视台的信息,而只把seoclub相关的信息显示在最前面.我们就可以这样写:seoclub –tv

对一个搜索引擎营销者来说,了解这些就可以避免在给产品或网站取名的时候,取一些会跟其他词一起出现的(就是需要加上类似”+-”才能搜索到的)的名字

(其实这些常被seoer来作为他们在查找信息的时候使用的一些过滤手法)

接着就到了搜索引索库了,也就是下面的第二步。

第二步:选择与搜索引擎请求匹配的结构

当我们看完上面的几个步骤后,到了这里其实也更容易理解了.只是在个匹配的搜索结果,还有一个是付费的搜索结果在内.这里就不讲了,我们只讲自然搜索.

A:选择自然搜索匹配的结果

自然搜索引擎使用搜索索引库定位最匹配的网页.基本上,通过分析搜索请求决定查找什么词-------不仅是在搜索请求中键入的那些词,还有词的所有变体(比如this 和these,或者 woman 和women),以及忽略哪些词(停止词和非词组)。搜索引擎查看搜索请求中的每个词,看哪些网页包含这些词。

搜索引索库可以被看做一个按字母顺序排列成的列表(说更通俗点,就是像一本词海或者说百科全书,具体可以查阅――如何最通用的去理解这个概念:什么是seo),列出了互联网每一个网页上的每一个词(参照下图表):

搜索引擎怎样被从索引库中找到示意.自然搜索引擎检查网页列表的索引,网页列表列出了包含搜索引擎请求中的每个词的所有网页.

以上只是一个最简单的例子。

事实上,搜索者常常不是这么单一的去搜索一个问题。比如,他不会搜索美食节,可能是广州美食节,上海美食节等等。于是,搜索引擎就要做多方面的分析判断。首先会先找出含有该关键词的所有页面,给出一个含有“广州”和“美食节”的网页列表。大多数的搜索引擎在遇到这种情况时,都是先显示同时含有“广州”和“美食节”或者是“上海”和“美食节”的网页。

还有一种情况,就是更长的句子。比如“广州美食节在哪一天”,显然,美食节,将是这个关键词里的关键词,所以,一些只含有美食节的网页也很有可能会显示在前面。

关于搜索引擎是如何工作的解说。就讲到这。事实上,搜索引擎工作的复杂性,一时讲不了那么清楚,而且我们也无法彻底清楚。

本稿由seo俱乐部提供站长站,如无经过本站同意,转载务必写明出处与文章链接。

文章出处:http://www.seoclub.net/seo/seo_se.html

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有