利用网站日志看百度蜘蛛 分析网站收录情况

王朝网站推广·作者佚名  2011-12-05
窄屏简体版  字體: |||超大  

对于多数个人站长来说,认为百度收录减少或者是快照回档就是K站的前兆或是百度降权,其实根据我对自己站的日志分辨,完全可以用网络日志的百度蜘蛛爬行的返回代码来确定自己的站在百度的数据库里是否正常。

首先,我们需要打开我们的网络日志,虚拟主机服务商一般都会有日志空间,在ftp里面的www_log文件夹里,下载下,进行解压, 用记事本打开,然后搜索Baiduspider 观察每个Baiduspider上的百度蜘蛛爬行后的返回代码。

不出现特殊情况下,百度来的IP有220段,并且只要有一个返回代码是200,那么就不是K站或者是降权,那样就可以放心了。蜘蛛抓取网页如果返回200 0 0代码,则表示该网页已经成功编入索引,200 0 64是指索引数据库已经存在,没有发现网页有更新的内容,不需要重新索引的意思。304 0 0是指原来缓冲的文档还可以继续使用,跟200 0 64意思应该差不多吧。现在网上很多人说200 0 64返回是K站或者是降权,其实不然,在蜘蛛排行动态网站的时候也是返回200 0 64

那么怎么样才能分辨是否被降权呢,一般情况下,百度蜘蛛只来自一个IP段那就是123.125.68.* 或者是123.125.68.*这个段经常来,别的段非常少,那基本就可以确定自己的站已经进入百度沙盘了,此时要格外小心,除了减少作弊操作之外,还要坚持更新网站,有节奏的发外链,当220段的IP在此大规模进来的时候,就是即将解除沙盒期间了。另外61.135.168.*这个段的蜘蛛是抓取图片的,在网站没被降权的情况下,只要有两个IP段的蜘蛛(比如我的日志里的220.181.7.*和123.125.66.*这两个段)都抓取了网站首页且返回的状态码是200 0 0,那第二天的快照就肯定会更新了,所以很多站长就不用熬到4点看快照会不会更新。

一般百度首页快照比较慢、网站权重比较低或者被降权的网站,蜘蛛一般都是返回的200 0 64的状态码。例如我有一个被K过的www.400wo.com,当时每天都只有123.125.68.*这个段的IP,且状态码都是返回的200 0 0。

本文来源:xwkj.org

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航