最近用火狐打开我的网站,发现URL后面会出现一个圆圈,里面有个“C”,不知大家是否注意到,越来越多的网站(尤其是Wordpress搭建的网站),在Firefox中都会出现这个图标。如图:
里面是个C字母,alt提示“Current location matches the specifed canonical page”。
打开某些网页时,此标志又会变成蓝色,alt会提示“Go to the canonical page at http://…”。这个标志原来是canonical (权威链接标记)标签在起作用,早在09年2月份,Google,Yahoo及Microsoft三大搜索引擎联合推出了一个旨在减少重复内容困扰的方法,这对于广大站长来说不啻是个好事情,不用再担心因为网站上有重复的内容而影响到网站页面的权重了。
造成重复内容的原因有很多,最常见的便是多个url地址指向了同一个页面,比如:wordpress平台下的一篇日志页面,包括了文章及评论内容。每个评论都可以有个固定的链接地址,如http://www.hiw3c.com/website-seo/#comment-01这样的链接格式,如果有多个评论的话,则每条评论的链接都类似于上述格式,只是commentID号有所不同,这些链接其实都是指向同一篇文章的。蜘蛛来爬时,便会依次爬行一遍,这篇文章下如有10条评论,则爬了10次相同的页面文章,相当于做了多次重复的工作,严重影响了抓取的效率,及耗费了带宽。
重复内容造成的结果必然是蜘蛛不愿意来爬,不同的url指向同一个页面,也会影响到该页面的权重。
比如文章链接:http://www.hiw3c.com/website-seo/和http://www.hiw3c.com/?p=220两个URL不一样,但是内容一模一样。重复内容容易造成搜索引擎的惩罚,所以作为网站管理员和SEO人,需要考虑避免这种重复内容对搜索引擎优化不友好的效果的产生。
现在我们可以在该页面的header区加上一句:
来声明,该页面中此url为权威地址。相当于给所有指向此页面的地址做了个301转向,那么搜索引擎读到此标记时,便自然会以此地址为主。
注意的是,该标签只能作用于同一个域,不同域是不起作用的。也就是说如果文章被其它网站抄袭,也不会因为这个标签而给你的原文章带来权重。
另外,你如果想通过canonical把其它一些不重要的页面指向某个重要的页面,以此来达到增加某页的权重,这个想法也是危险的,Google是可以检测出来的。
再有就是如果你没有加canonical标签的话,搜索引擎们也会自已去判断哪个地址是权重地址,只是既然要与搜索引擎打交道,那我们为什么不按照标准去表示一下友好的态度呢?
所幸的是,在我们使用的WP系统中已经有插件支持啦。在WP插件Platinum SEO和SEO All In One中,都有关于这个canonical的选项。只要将对应的选项选上,则生成页面的时候,会自动帮你产生这个标签。在最新的WP2.9版本中已经支持,不在需要插件安装就可以实现canonical标签。下面我整理了代码,需要的朋友直接复制就可以使用。
如果你的WP版本在2.9之前,需要通过插件(上面已经提到)或者手工 Hack 主题的 header.php 文件来使得博客支持。如在主题中加如下的代码:
在 WordPress 2.9 发布之后,WordPress 已经默认支持这一标签了,我们无需做任何动作,主题就支持这一标签。我们可以在 WordPress 的源文件 wp-includes/default-filters.php 看到如下的代码:
add_action( 'wp_head', 'rel_canonical' );
因此 WordPress 是调用 rel_canonical() 这个函数来输出 rel=”canonical” 标签的 HTML 代码。 如果你还想使用以前自己的方法,那么你可以通过下面代码屏蔽掉它:
remove_action( 'wp_head', 'rel_canonical' );
除了canonical链接标签,对于Google来说,你也可以在重复内容的页面的部分加入NOINDEX标签,但是很显然,对于很多具有重复内容的动态网址来说,这个标签很难派上用场。对于Yahoo,你甚至还可以通过Robots-nocontent语法来告诉Yahoo搜索引擎机器人哪些内容是最有用最新鲜的。除此之外,英文雅虎站长工具Yahoo Site Explorer还具有动态网址参数管理功能,不妨也可以登录上去设置一下,以帮助Yahoo搜索引擎更好地识别网站上是重复内容。
本文由http://www.hiw3c.com站长供稿!转载请注明出处,谢谢合作!