分享
 
 
 

正确使用robots.txt至关重要

王朝网站推广·作者佚名  2011-12-02
窄屏简体版  字體: |||超大  

最近经常有朋友问我一些robots的问题,今天我就将robots使用的一些心得和技巧和大家一起分享一下,欢迎各位拍砖指正。

robots性质:TXT的文本文件。

应用原理:当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。

方法:User-Agent: 适用下列规则的漫游器 Disallow: 要拦截的网页 ,下面是一些常用的robots文件的写法,供大家参考

robots的作用:1.网站管理者可以声明该网站中不想被搜索蜘蛛访问的部分,或者指定搜索引擎只收录指定的内容,可以有效的保护网站管理者的信息2.根据奥卡姆剃刀定律(http://www.chengshinet.com/SEO/20090114-88.html)避免站内搜索的结果页和一些动态链接产生的重复页被抓取而影响网站的整体质量。3.robots.txt文件里还可以直接向搜索引擎指出网站地图sitemap文件的位置。4.避免蜘蛛光临网站查看robots文件时产生404错误信息。

下面介绍一些,robots的一些技巧和具体操作;

1.限定搜索蜘蛛抓取的文件的范围:

允许所有的搜索蜘蛛的访问

User-agent: *

Disallow:

禁止所有搜索引擎访问网站的任何部分

User-agent: *

Disallow: /

禁止所有搜索引擎访问网站的管理登陆后台,以防泄露网站信息

User-agent: *

Disallow: /admin/

禁止某个搜索引擎的访问(即下面提到的淘宝屏蔽百度)

User-agent: Baiduspider

Disallow: /

只允许某个搜索引擎的访问(下例中的Google)

User-agent: Google

Disallow:

User-agent: *

Disallow: /

禁止蜘蛛抓取特定文件类型(例如,.txt)的所有文件,可使用以下 robots.txt 条目:

User-agent: *Disallow: /*.txt$ 要阻止搜索蜘蛛抓取所有包含 ? 的网址(具体地说,这种网址以您的域名开头,后接任意 字符串,然后是问号,而后又是任意字符串),可使用以下条目:User-agent: GooglebotDisallow: /*?2.禁止某些搜索结果页和打印页面的被抓取。http://www.chengshinet.com/robots.txtUser-agent: * Disallow: /plus/feedback_js.php Disallow: /plus/mytag_js.php Disallow: /plus/rss.phpDisallow: /plus/search.php 3.robots文件中 提交网站地图User-agent: *Sitemap: http://www.xxx.com/sitemap.xml目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,但是有的时候搜索引擎为了维护搜索的公正性和良好的用户体验,仍然对一些重要的URL进行了有效的索取,我们来看一个 robots.txt范例:http://www.taobao.com/robots.txt访问以上具体地址,我们可以看到robots.txt的具体内容如下:

User-agent: BaiduspiderDisallow: /User-agent: baiduspiderDisallow: /以上文本表达的意思是禁止百度的搜索机器人访问www.taobao.com 站点下的所有文件。

具体语法分析:User-agent:后面为搜索机器人的名称,后面如果是*,则泛指所有的搜索机器人,如果是相应的如baiduspider即为百度蜘蛛;Disallow:后面为不允许访问的文件目录。目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则但是当你使用百度搜索淘宝的时 候,仍然会出现网站的索引,如下图

但是不容质疑的是robots文件也会使泄露一些网站的登录后台的地址,很多网站管理员认为屏蔽了搜索蜘蛛,网站就安全了,其实有的时候也就泄露了网站的信息了,怎么保证信息的不被泄露呢,最有效的方法是对robots文件进行301重定向设置。

本文首发:成事网络营销 http://www.chengshinet.com/blog/ 站长QQ:573218273 欢迎大家拍砖指正,新建SEO知无不言群61842653,欢迎SEO的爱好者加入,一起共同进步!

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有