搜索引擎的原理
搜索引擎利用称为“网络蜘蛛”的搜索引擎机器人通过网页上的链接地址来寻找和抓取网页。蜘蛛会连接网络上每个页面的超链接,从少数几个网页开始,便可连到数据库上所有到其他网页的链接,直到把所有网页抓完
为止。如果把整个互联网想象成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。抓取网页的同时,搜索引擎也会对抓取的内容建立索引,以便用户查询的时候迅速找到相关内容。搜索引擎建
立网页索引时,处理的对象是文本文件。对于蜘蛛来说,抓取下来网页包括各种格式(如html、图片、doc、pdf、多媒体、动态网页及其它格式等)。这些文件抓取下来后,需要把这些文件中的文本信息提取出来。这也
是为什么我们在搜索内容的时候那么快,因为搜索引擎通过全文检索为我们展示的是经过索引的纯文本的内容:)当然,还包括一些其他技术因素如服务器分流,减少并发量、在当地设立服务器加速等。
搜索引擎排名的重要因素
搜索引擎的目的是为人们提供最精准的匹配结果的内容列表,让人们更快速的找到需要查找关键词的结果页面。所以,对搜索引擎来说,准确提取被索引文档的信息,对搜索准确性有重要作用,另一方面对于蜘蛛正确跟
踪其它链接有一定影响(判定页面权重有一定影响)。
由此推断,搜索排名的因素可能涉及到了以下问题:(问题排名相互制约,重要性不分前后)(补:搜索引擎的数据库中是否收录并索引该网页(如果要没有收录还谈什么排名,这也是我们为什么要掌握提交搜索引擎和目录的重要技巧:P)
数据库中被索引的网页与查找的页面的关键字的相关度如何?
数据库中被索引的网页被索引的时间是什么时候?
被索引的网页被索引时的访问量如何?跳转率又如何?
其他相关关键词的网页对排名的页面的评价如何?
对排名网页进行评价的网站是否多元化?权重又如何?
一个优秀的搜索引擎的排名算法就好像一个完善的投票评价机制,用细微的逻辑条件去客观判断一个网页在对应某个关键词时的相关性和重要性。因此,就像上面提到的,“问题排名相互制约,重要性不分前后”一样,
对于每个影响网站排名的因素都不是绝对的。关键词密度高的网页并不一定就排在前面,PR高的也不一定排在前面。我的理解是:网站内外兼修,才会有一个好排名。
内外兼修之内功:
标准、专业的URL、合理的关键词选择与部署,告诉搜索引擎,我是谁,做什么。原创、优质的内容,良好的用户体验,告诉搜索引擎我很独特、很专业、很优秀。保持稳定的速度更新内容,告诉搜索引擎我一直在努力,并且值得信赖。
将相关内容用合理的站内锚文本,自我评价我的内容,告诉搜索引擎,我的什么内容是重要的,哪些值得关注。
内外兼修之外在:
指向网站的外链数量告诉搜索引擎我的权重。外链锚文本的名称告诉搜索引擎别人对我的评价。
搜索引擎的算法和技术是日新月异的,只有真正做到内外兼修,坚持不懈,才能以不变应万变,顺应时代和技术的发展变化,在搜索排名和目标市场上立于不败之地。内外兼修,这就是所谓的“好排名的解决之道”。
而我们要时刻提醒自己:优化搜索排名只是一种手段。我们关注更多的应该是我们的目标市场客户 / 用户,他们的思考方式和行为决定了我们的产品(或网站)的战略和战术的方向。满足客户 / 用户需求永远是赢得市场的重中之重。