大部分的网站管理员都已经知道重复内容能给网站的排名带来负面效应。但是怎样才能检查某个特定的网站是否存在这个问题,并且怎样才能减少或者避免它呢?
从一开始,可以将重复内容划分为两个主要的种类:
网站结构导致的重复内容
内容盗窃导致的重复内容
关于网站结构导致的重复内容
一些网站结构本身会引起重复内容,实例如下所示:
打印友好(ptint-friendly)的页面
在多个页面上具有大体相似的内容,而能通过不同的URL地址访问
页面上有非常类似的单元,比如在一个电子商务种类中,一连串不同颜色的衬具有相似的描述
页面是一个追踪应用程序的会员程序的一部分,且这个程序配置不正确
多个页面有重复的标题或重复的meta标签值
在URL地址中使用会话ID
标准化问题
为了查找网站结构导致的重复内容,可以使用site:www.yingyuxuexi.org.cn查询串来检查已被搜索引擎索引过的网站的URL地址。所有主要的搜索引擎(Google,Yahoo!,Microsoft Live Search)都支持这个功能。通常,“打印友好”的页面如果被索引的话,就会很快显示出来。
Google经常将它认为是重复内容的内容放在“补充索引(supplemental index)”中。在搜索引擎结果的最底下有个补充材料的标记,放置的就是这些内容。当然,现在Google已经将这个标识隐藏起来了。如果某个Web站点有很多页面出现在补充索引中,可能意味着这些页面是重复内容——至少Google这么认为。如果可能的话,研究这几个页面的URL地址,并查找有没有前述的情形。特别要看看位于结果后面的页面。如果不注意就特别容易产生重复内容问题,因此以有利于搜索引擎的观点去看将很有用处。
关于内容盗窃导致的重复内容
内容盗窃产生的是一个完全不同的问题。正如盗贼能偷真实的财产一样,他们也能窃取内容。毫无疑义,这是为什么它被称为内容盗窃的原因。而这为搜索引擎带来了问题,因为搜索引擎努力从搜索结果之中(也从不同的网站之中)过滤重复内容,难免有时会对哪些是原创权威内容做出一些错误认定。
在某些情况下,这是个隐蔽的问题,并且可能给排名带来灾难性的影响。如果你是内容盗窃的牺牲品,并且想要有所行动,那么首先要给那个使用非法内容的人发送一封要求暂停并中止的信。可以使用该网站提供的联系信息,或者该域名在WHOIS记录中的联系信息。如果这个方式失败,那么可以找主流搜索引擎来警告他们的内容盗窃行为。
下面是主流搜索引擎负责此事的URL地址:
Google:http://www.google.com/dmca.html
Yahoo!:http://docs.yahoo.com/info/copyrighffcopyright.html
基本上只要一个网站是坚持不断的更新原创内容,百度、Google、雅虎等搜索引擎已经能够很好的识别原创内容的原始出处。网站管理员需要做的就是,每天坚持更新高质量的网站内容。
作者:街舞者-街舞-HipHop-中国最大舞者的交流平台 来源:http://www.jiewuzhe.com