互联网上各种观点层出不穷,在SEO行业有一个普遍传说的技巧:到百度文库上传文档发外链。许多人认为这样做了之后,会给自己的网站带来高权重的外链。网络营销分析师苏笛康认为,所谓的百度文库高质量外链,只存在于想象之中,是不切实际的幻想。
什么样的链接算外链
经历过中国电子商务协会SEO工程师认证考试的朋友应该都记得,该考试对外链部分的知识考查非常详细。这里苏笛康就不引用官方定义,采用比较通俗一点的说法。所谓的外链,或者说外部链接,严格说来要满足三点要求(这是比较苛刻的标准):
第一,该链接必须是可以被蜘蛛抓取的。如果该链接可以被看见,但是不能被蜘蛛抓取,就不算外链。任何不能被蜘蛛抓取的东西,对搜索引擎而言,都相当于不存在,或者称“存在着的无”。
第二,该链接必须能让蜘蛛顺利通过。一般说来,无法被点击的链接(文本形式的URL),自然也无法指引蜘蛛通过,这种链接,也不是外链。当然,文本形式的URL对权重是否有影响尚有争论,我们一般认为它对权重的影响微乎其微。
第三,该链接必须能够传递权重。加入了nofollow标记的链接,虽然能被蜘蛛抓取,也能让蜘蛛顺利通过,但是它拦截权重传递,严格说来也不算外链。几乎所有的Wordpress博客留言时填写的Website外链,都是这种无效外链。严格说来,这种外链并非一无是处,它也有导入流量、吸引蜘蛛的作用。
百度文库的外链是镜中花
百度文库和豆丁网,都可以实现文档的在线预览,采取的方法就是:Flash。大家都是做搜索引擎优化的,都清楚Flash对搜索引擎意味着什么。
搜索引擎无法抓取Flash文件内部的信息已经是SEO行业的共识。虽然Google曾表示和相关公司合作,已经可以抓取Flash和图片文件内的文字内容,并可以部分解析JS代码,但这毕竟只是Google一家之言,而且是英文Google。换句话说,到目前为止,Flash内部的信息,仍然是难以抓取的。Google所谓的抓取Flash内部文字,可能存在如下限制:第一,只能抓取英文某些字体和大小,无法抓取东方文字(懂一些OCR文字识别知识就可以理解这一点),第二,可能无法理解Flash文件中的链接。
那么百度能否抓取Flash内部的文字及其链接?我想,这个大家心里都有数。如果一个链接无法被蜘蛛抓取,它的外链意义就不存在。所谓的百度文库高质量外链,只是镜中花水中月而已。
实测百度文库抓取情况
百度蜘蛛的抓取方式,和一款浏览器很像:Lynx。很高兴国内有一位SEO前辈制作了一款在线版Lynx,我们今天就用这个浏览器观察一下百度蜘蛛如何抓取百度文库。
笔者在百度文库上传了一个包含大量锚文本链接的PDF文件,文件名为《苏笛康:软文写作的文字能力如何培养》,百度文库相应的地址是:http://wenku.baidu.com/view/532b4d25a5e9856a56126013.html 。使用Lynx浏览器访问该URL,结果如下(下面只是部分结果截图,详细结果请到 http://lynx.semyj.com/ 实测):
由上图可知,Lynx浏览器未能识别百度文库中文件的内容,直接跳过了。我们把浏览结果拉到最底下查看网页内部的链接,可以发现,该PDF文件中的锚文本,没有任何一个出现在链接列表中。现在我们基本可以肯定,百度蜘蛛也无法抓取百度文库中文件内部的链接。
百度文库对SEO的真实价值
SEO是一种流量获取方式,而百度文库是一个独立的流量聚集地。虽然我们无法利用百度文库获取外链,但每天有无数人通过百度文库搜索相关信息,我们只要把相关文章做成PDF上传到百度文库,就可以提高网站知名度,间接推广网站。
此外,由于百度文库的高权重特性,也可以用来稀释负面信息,用于品牌维护,无疑是一件利器。
百度文库的外链只存在于想象中,但百度文库的价值依然不容小觑。虽然现在百度文库受困于版权纠纷,但短期内百度文库不会消失(百度比我们想象的要强硬的多)。百度文库在网络营销中的作用依然强大,如何榨取百度文库的价值才是我们需要研究的。
本文作者网络营销分析师苏笛康(http://www.sudikang.com),转载请注明出处。订阅苏笛康的博客即可获赠价值99元微博营销指南,不要错过。