看了很多文章,都是关于服务器日志的,似乎没有定论。经过我对服务器日志的分析和了解,做一下结论:
1、服务器返回200 0 0 ,代表着baiduspider对服务器进行了请求,得到了回应,抓取了新的数据。此种情况下,搜索引擎的处理流程是,如果是新发布的文章内容,百度抓取并放出的可能性大于70%。如果是很早之前发布的文章,一般不会抓取以后马上就释放,一般到大更新,或者是进行数据对比,确定不是垃圾内容以后,再进行释放。
2、服务器返回200 0 64 ,很多人认为这是被百度K掉的前兆。也有不少SEOer站出来解释,这种情况未必是K站,一般有三种解释。
目前,对于 200 0 64 的观点大致分为以下几种:
会话故障,请求不可到达,并非百度封站征兆
百度封站、“拨毛”或放入沙盒
64位操作系统
樂思蜀参考了大量相关文章,虽未得出最终结论,但觉得第一种观点最合理,现分析如下。
首先来看 200 0 64 状态码的构成
200 0 64:sc-status(协议状态) sc-substatus(协议子状态) sc-win32-status(Win32状态码)
sc-status(协议状态):200 连接成功
sc-win32-status(Win32状态码):64 指定的网络名不再可用
以上内容摘自乐思蜀博客空间
以上三种解释都有合理之处,不过经过我对服务器日志的分析,研究如下:
出现200 0 64代码,一般情况下,代表着baiduspider曾经在此路径下抓取过内容。通过对比,搜索引擎认为该网页没有必要再重新进行抓取。这路径下的页面,有可能之前已经抓取过,但是未释放,也有可能是抓取过,已经释放。
通常情况下,我们可以通过服务器日志的分析,列出200 0 64的页面,对此类页面,进行简单的改动或者是处理,这样的话,应该可以引起搜索引擎的触发,重新对页面进行收录,可能会当时释放。
已经被收录的页面产生64代码,应该是百度记录此页面被用户频繁访问或者是通过搜索引擎得到搜索结果后点击网站,造成baiduspider跟踪用户行为,对页面进行重新访问。
所以,我们可以针对服务器日志,开发一个适合seo的服务器日志分析工具,通过此工具,可以真实记录蜘蛛或机器人的访问,并对访问返回的结果进行分析。可以通过分析,得到如何让更多的页面让蜘蛛抓取并获得良好排名的方案。
另外通过日志分析工具,从引申的角度讲,可以制作一个蜘蛛诱饵,主动引导baiduspider进行爬行和抓取,并获得良好的排名。我说的可不只是网站地图。
原文连接:http://www.wowsome.net/seoinfo/2009/1216/51410.html