Google、Yahoo、MSN/Live、ASK四大英文搜索引擎巨头近日联手推出了“canonical“标签,目的是尽可能的消除网站重复内容。
我把它翻译成“标准化”。这个标签可以帮助我们优化站内内容,提升网站权重及排名。
下面让我们来逐层分析一下这个新标签的意义及使用。
何为重复内容?为什么会产生重复内容?
首先,我们要明白搜索引擎把什么定义为重复内容。
简单说来,不同的URL指向相同的内容就造成了重复内容。重复内容一般分为三种情况:
采集内容。无论你采集别人的网站内容或者别人采集你网站的内容,都会产生重复内容。采集的内容是会被搜索引擎惩罚的,不在本文讨论范围。
站内内容重复,这种情况最常见于博客类网站。许多博客都是全文输出到首页,在首页你可以看到文章全文,文章页的内容和首页一模一样。这种情况搜索引擎是可以正常识别的。只要不是故意制造许多内容相同的页面来作弊,搜索引擎不会对网站惩罚。这种重复内容会对搜索引擎造成一定的干扰,具体表现就是有些博客首页在很多关键词都有排名,而包含真正内容的文章页排名不理想。
网站程序引起的内容复制。 由于服务器、网站CMS等因素,造成多个URL指向同一个页面。比如,下面这些URL可能都是指向同一个页面:
www.example.com
example.com
www.example.com/
example.com/
www.example.com/index.html
example.com/index.html
www.example.com/Home.aspx
example.com/Home.aspx
搜索引擎也不会惩罚这种重复内容,他们会选择一个URL进行索引与排名,但也许这个URL并不是你想要的那一个,同时,这些不同变体的URL对访问者也会造成一定的困扰。
如何避免复制内容?
可选办法:
用一个良好的网站CMS程序,控制CMS只生成你想要的那个URL。
全站做站内链接的时候,指向同一个页面的严格使用相同的URL
把造成重复内容的URL通过301重定向到唯一URL
去Google网站管理中心,设置偏好的网址,选择带www或者不带www其中之一
向搜索引擎提交XML格式的网址地图,把你想让搜索引擎收录的URL放到里面。
可能遇到的问题
你的程序并不够好,它会产生一些重复网址。比如同时生成 www.example.com/catalog/ 和 www.example.com/catalog/index.htm。
你能控制站内链接的统一,但别人给你做的链接URL往往不是你能控制的。
你不会做301跳转,或者你的空间根本没有给你权限做301。
网址的大小写
不同用户Session ID不同,但内容一样
内容排序方式不一样,比如按价格顺序或逆序排列产品
如何做标准化?
在所有你认为可能造成重复内容的网页头部<head></head>之间加入下面这句代码:
<link rel=”canonical” href=”http://www.example.com/page.html” />
告诉搜索引擎该内容唯一对应的URL,并要求搜索引擎只索引、排名该URL。
注意事项
这只是一个提示,并不是强制执行。搜索引擎会自己决定是否采用这个提示,这点就不同于301重定向。
最好是先尽量避免产生重复内容,然后再考虑这个标签。如果你是一个高手,请把这个当做你的最后手段。
如果发现有人利用该标签作弊,搜索引擎可能会采取相应的措施。
常见问题
问:标准化能不能跨站使用?
答:不能。不能把a.com下的内容标准化到b.com。
问:这个能不能跨子域名使用?
答:可以。如,可以把a.example.com下的内容标准化到b.example.com。
问:我可不可以把http的内容作为https内容的标准。
答:当然可以。
问:这个和301重定向有什么区别?
答:二者功能类似。在你没有权限或者不会做301重定向的时候可以考虑使用这个。
问:标准化的页面的内容是不是必须完全一样?
答:不是。它们必须至少很相似,有一点差别是可以的。
问:我要使用相对网址还是绝对网址?
答:二者皆可。但我们推荐绝对网址,这样可以尽量避免出现错误。
问:你们会追踪标准化的多重链吗?
答:也许会,但不会相信这个。直接把网页标准化到最终页面。
问:如果我把网页标准化到404页面,或者导入到死循环,又或者一个阻止蜘蛛抓取的页面?
答:搜索引擎会尽力解决这些问题。但请不要做出格的事情。
本文来自谷百优:http://www.ouyangchun.com/