一、重复内容的定义是什么?
重复内容也叫复制内容,从广义上来说是复制网上已经收录的网页内容到其他网站里。重复内容一般指同个域名下多个重复内容的网页。一般情况下,重复内 容的出现都不是站长有意这么做的,而是内部结果或改版不到位的结果。但也有些站长故意做很多重复内容,来提升网站流量或谋取某些利益,比如最近几年大行其 道的织梦系统,自己本身都带采集功能,还有许多站群软件也自带采集伪原创工具,这些都是恶意的复制内容行为,是不可取的,对互联网本身的发展没有好处,只能出现越来越多的垃圾内容。
二、重复内容对网站优化有什么影响?
大家明白,人们都喜欢新的、独特的、原创、高质量内容,搜索引擎是为用户服务的,所以在判断网页的时候也秉着这个标准。搜索引擎自己有一套判断复制内容的程序,所以我们做内容的时候尽量不要去做重复内容。在这一点上,百度显 的更加严格,这点做站群的站长肯定深有体会,常常会遭到百度的全面封杀,K掉所有网站。谷歌和雅虎并不会有百度这么严格,一旦发现你的网站大部分都是复制 内容后,仍然会保留你的收录,但不会给你好排名。你即时有几十万的收录量,可能只有几十的ip也很正常。这就是几个搜索引擎对待复制内容的不同区别。所 以,我们在“创作”文章内容的时候,尽量不要去抄袭复制别人的内容,没有任何意义。
三、重复内容的优化策略
有时候,出现重复内容是不可避免的。比如我们公司博客里面的文章,经常被转载到别的网站,那么如果让你的网页在所有相同的网页中排名靠前呢?
随着搜索引擎技术的不断发展,判断重复内容的手法也越来越精妙,大部分情况下,都能判断出内容的原始出处。但有时候还是不能避免弄错的时候,比如新 浪发一篇长娥二号升天的文章,我也发一篇,内容一抹一样,并且新浪是转载自我们公司博客的,那搜索引擎很有可能把新浪发布的内容当作原始出处,这就是我之 前一篇文章说的关键词权重传递,有兴趣的朋友可以看下这篇文章《网站排名中的关键词权重传递》。我们要做的就是尽可能的帮助搜索引擎判断原始出处。
1、保证内容的独特性,避免和其他网页的内容重复。就现在来看,搜索引擎判断一个网页的重复性,还是比较难以捉摸的,不过你的内容如果超过60%和另一个内容不同,一般情况下你的内容就是“原创的”
2、如果你的内容是首发,也几十原始出处,尽可能的在内容重添加版权信息。或者在内容重添加网站的url和锚文本,这样一来,即时别人采集去,搜索引擎也能从链接上判断文章的原始出处。
3、如果你的内容确实是转载或者采集的,那伪原创也要做到位,最最吗标题、描述和内容的抬头要改掉。
4、如果只是你网站内部结构的问题,请尽快解决,有些重复的内容可以用301重定向技术实现。目前发现,百度对301不是很感冒,经常要几个月后才 会改变链接,而谷歌只要一个星期左右。所以,我们在改版、改结构的时候要显打算好,把链接做到一步到位,不要改版好再慢慢改,这样会来不及。
本文固定链接: http://www.nbseoer.com/archives/1293