关于404的来历,这是由HTTP请求(类似在IE地址栏打上地址,回车,显示信息,这就是一个HTTP请求,但不止这一种,还有POST,机器人等行为)服务器,而服务器在给定的地址找不到任何资源的情况下返回来的状态代码,它的英文名称叫:SC_NOT_FOUND。
这里抓几个默认的404页面:
一般每个WEB服务器都会有一个默认的404页面,目的是要告诉浏览者其所请求的页面不存在或链接错误。这些默认页面很丑陋,可能还是一堆普通网友看不懂的代码(如上两图)。显然,站在SEO,用户体验上看,这并不能引导用户使用网站的其他页面,代替的是毫不留情的关掉我们的页面并一走了之。
404页面对SEO的影响
自定义404错误页面是增强用户体验的很好的做法,但在应用过程中往往并未注意到对搜索引擎的影响,譬如:错误的服务器端配置导致返回“200”状态码或自定义404错误页面使用Meta Refresh导致返回“302”状态码。正确设置的自定义404错误页面,不仅应当能够正确地显示,同时,应该返回“404”错误代码,而不是 “200”或“302”。虽然对访问的用户而言,HTTP状态码究竟是“404”还是“200”来说并没有什么区别,但对搜索引擎这则是相当重要的。
搜索引擎蜘蛛在请求某个URL时得到“404”状态回应时,即知道该URL已经失效,便不再索引该网页,并向数据中心反馈将该URL表示的网页从索引数据库中删除,当然,删除过程有可能需要很长时间;而当搜索引擎得到“200”状态码时,则会认为该url是有效的,便会去索引,并会将其收录到索引数据库,这样的结果便是这两个不同的url具有完全相同的内容:自定义404错误页面的内容,这会导致出现复制网页问题。轻则被搜索引擎降权,重则会K掉网站。
可见404页面对SEO的影响不容忽视,一不小心则有散命的危险。那么接着注重的话题就是:如何制作一个有利于用户体验,有利于SEO,能留住用户的404页面;还有就是在服务器上如何设置。
第一:如何制作?说之前让大家看几个案例:
把以上三个案例与默认404页面相比下,哪个更有亲和力,哪个更能留住用户,其答案是不言而明。从经典的案例我们可以总结出制作404页面的几个要点:
1、 要告诉用户所在的处境——没找到信息,出错。
2、 要告诉用户出错的原因。
3、 用生动的语言或图片来缓解用户的情绪。
4、 告诉用户下一步该如何解决问题。
5、 留住用户,增强亲和度。
第二:说下如何在服务器上设置的问题,其实这个问题在网上很多地方都可以找到。
1. 对于存在的网页内容由于路径改变而导致访问不了时,可在IIS 中定义404错误指向一个动态页面,在页面里面使用301永久重定向跳转到新的地址,此时服务器返回301状态码。
2、设置404指向一个设计好的html 文件,此时页面返回的404状态码。 现在的idc提供商基本都提供404设置的功能,直接上传文件设置即可。在IIs中设置方法:打开IIS管理器-->点击要设置自定义404的网站的属性-->点击自定义错误选项-->选中404页-->选中并打开编辑属性-->设置成 URL --> URL 里填写“/err404.html”-->按确定退出再把做好的err404.html 页面上传到网站根目录下。此处在“消息类型”中一定要选择“文件”或“默认值”,而不要选择“URL”,不然,将导致返回“200”状态码。
3、404指向一个动态页面,比如error.asp,如果不在页面里面进行设置,仅仅是返回提示的HTML 代码,将导致页面返回200 状态码,这是不正确的,我们可以在显示完提示内容后,增加语句: Response.Status="404 Not Found" ,这样就保证页面返回404状态码。
4、Apache下设置404错误页面。为Apache Server设置404错误页面的方法很简单,只需在.htaccess 文件中加入如下内容即可,ErrorDocument 404 /notfound.php。
最后几点注意:
1、 切记不要将404错误自动转向到网站主页,否则可能会导致主页在搜索引擎中消失。
2、 在robots.txt文件把404页面屏蔽掉。