观察小憩:平时爱好网络,对于很多网友迷惑的 200 0 64 状态码也给解读一下。
首先我们先分析一下200 0 64 状态码的构成:
200 0 64:sc-status(协议状态) sc-substatus(协议子状态) sc-win32-status(Win32状态码)
sc-status(协议状态):200 连接成功
sc-win32-status(Win32状态码):64 指定的网络名不再可用
首先,200状态,大家都很清楚,只有浏览器发出请求到收到完整请求时,才会是200状态,这证明此次请求无程序和网络错误。
其次,至于64出现的原因,首先要想到:各搜索引擎爬虫拥有快照,服务器正常影响产生并记录200状态,搜索引擎依据自己的标准判断该页面是否需要更新快照,然后,当得到当前数据不需要重新下载后,就主动断开与服务器的此次对话,这时服务器就将标注为64状态(大家知道,64代表指定的网络名不再可用)。
IIS日志分析如下:
例如新站ITSobserve.com ,百度蜘蛛只要遇到跟目录下的index.html 就是 200 0 64状态,但是内页几乎全部是 200 0 0状态,因此我们可以判定出现 200 0 64的另一个原因,就是新站尚处于考核期,暂时不收录。至于老站那就是如上分析的原因了。没有原创内容 site 文章标题 前面几页都是一个样,百度肯定不收录的。
由此我们可以看出百度蜘蛛收录页面的一个大致过程。
蜘蛛首先依链接或者其他方式踩到这个新站,对页面内容进行分析尤其是title,无论首页还是内页蜘蛛都会首先根据域名的权重来判断是否收录或更新快照,如果权重低会返回200 0 64状态,对于内页重点分析title,如果蜘蛛库内已有很多类似页面就返回 200 0 64状态,如为原创则收入囊中或更新快照。
因此经过上面的分析,以及我对其他网友观点和分析和对我自己服务器日志的分析,百度蜘蛛出现 200 0 64 状态码也就很正常了。现得出结论,而且个人觉得这个结论将是终结版。
如果想解决这个问题,那就是更新内容或增加外链,尤其是原创内容。
(来源:智能交通观察)