我们在分析ISS日志的时候,经常会看到200 0 0 200 0 64这样的状态码。200 0 0代码就不多说了,标志蜘蛛访问页面成功,并带回数据库。带回数据库后会进行一系列的计算,如果发现你的页面是采集的,互联网上出现的大量重复的内容,并不能给带给用户需要的信息,那么可能就会直接删除不会出现在索引列表里,或者出现在索引的列表里而没有权重没有排名;反之亦然。
颇具争议的是200 0 64状态码,一直笼罩着一层神秘的面纱,网上有很多种说法。大概可以分为以下几种:
1、 表示网站被降权,是网站被K的前兆。似乎和很多站长遇到这样的情况以后的结果就是被百度拔毛。
2、 百度蜘蛛是有64位的系统放出,所以状态码为64。
3、 网络不可达,就是蜘蛛GET成功,但未将整个页面爬行完毕,页面未完全打开。
我比较同意第三种说法。IIS日志出现200 0 64状态码,并不代表网站就一定会被K。那么为什么很多人又说从发现后,结果就是被K了呢?
首先来分析下蜘蛛爬行一个页面的过程。我认为,蜘蛛在爬行一个HMTL页面的时候,如果在限定的时间内,未读取到HTML的结束标签,那么就表示这个页面未完全打开。状态码就会出现200 0 64。这个多半是由服务器空间的不稳定,DNS解析不稳定等原因造成页面不能完全打开。有的朋友会说为什么我用非常好的空间或者服务器,上面的其他站都没出现这个情况,就我的出现了呢?如果是这样,你就需要检查下你页面里的JS代码或者框架或者控件哪些的了,这些也会造成你页面在一定时间内不能完全打开。
你想,蜘蛛会喜欢一个速度非常慢,经常都不能完全打开的页面吗?当你的IIS日志出现了大量的64状态码,时间久了,被K就是顺利成章的事情了。当你出现这样的情况的时候,请检查你的页面打开是否流畅,在高峰时段是不是会出现无法访问的情况。或者你的页面是否存在影响打开速度的因素。
至于第二种说法,64为的操作系统,我认为没有什么根据的。