做搜索引擎优化(SEO),外部链接建设当中提到比较多的就是链接的相关性的说法,毕竟呢,你的这些外部链接大部分是做给搜索引擎看的,而搜索引擎是靠蜘蛛程序来抓取得。
记住,“蜘蛛”是个抓取“程序”,不是“人工智能”。他不会用人类的判断逻辑来判断相关性,而是一些“逻辑程序”,毕竟蜘蛛程序并不复杂(对比来说)。
明白了上述情况,我来说说我自己对“相关性”的看法和建设心得,不对之处,还请大家指正。
你的网页和你网页中的内容相关性,在蜘蛛程序中的判断:
假设你的网页是新的网页,刚做了不到2天,刚提交,蜘蛛根据“抓取索引”,过来抓取(或通过其他形式的链接)。
首先,蜘蛛通过各种链接来到了你的网页,对于他来说,新的网页特征就是从网页代码中的部分中的<head>部分中的<title>标签里的元素来判断的。
假设蜘蛛来到的你这个网页,抓取了网页中的<title>文字:我的动漫论坛 -新动漫 - 动漫新主张!
蜘蛛首先会以抓取<title>中的文字做为“关键词”为参考,然后去从网页代码中去寻找相关的“关键词”。
你可以放心,蜘蛛可以判断一些JS代码和页面中的标签,他会比较重视正文和div块中的标题部分的“关键词”,也就是<h1>-<h4>一系列的。这也可以验证大家说的,为什么<h1>-<h4>中的内容,会比其他<body>中的文本内容权重高的原因。然后蜘蛛会把<tilte>中在正文<body>部分重复次数最多的词,定为“参考关键词”(当然了,有个重复限度,搜索引擎会设定并嵌入蜘蛛程序里)。
然后蜘蛛自己也会根据“参考关键词”判断“关键词扩展”(根据搜索引擎的相关类的常用数据关键词和title中关键词分析对比),综合以上,确定大体的“关键词”,做为下一步页面抓取的参考。
下一步,蜘蛛会计算(这个简单的数据计算功能还是有的)所有关键词在网页代码中出现的数量,作为基数。然后计算<body>标签中“关键词”的数量,作为分子(汗,想不出什么词了,通俗第一)。然后一除,就得出了你这个页面的关键词密度。
密度出来了以后,搜索引擎自己会有个标准判断(人为设计的参数),有个等级是最合理的,是一般的还是最差的,这个标准时刻在变,总之是根据一段时期的数据进行调整的(就是让你隔段时间闹一回心)。
好了,密度的判断出来后,进行本页的关键词差别对比。
以<tilte>中的关键词为基础,综合了“扩展关键词”的参考,对比在<body>部分中抓取的“关键词”,对比他们每个文字上的差别,差别也分个等级,差别不大的,成为了长尾关键词,差别大的,就被舍弃做为这个页面的搜索关键词,这个和“关键词密度”判断方法相同。 这样,页面长尾词和搜索关键词就确定了下来。
当密度和页面关键词差别这2项得到了2个结果后,会有个权数加的计算公式(引擎自己定的,也定期根据数据调整),得出一个对“相关性”的得分(类似baidu指数的算法),从而判断页面的关键词,确定页面内容和关键词的相关性联系程度。
页面的关键词和页面内容的相关性就这么得出来的。
那么,外部链接的相关性怎么判断?好,下面谈谈,进入第2部分
外部链接和网页相关性的判断:
单向链接:他网页链接到你的网页的链接。
在他的网页上,你网站的链接锚文字描述必须是和他链接到你的这个页面的关键词相关,或相近,蜘蛛的判断方法和第一部分一样,只不过起始的“关键词”参考,变成了在他网页上,你的网页的链接錨文字。
话说回来,这个网页的相关性和你的网站有多高,这个蜘蛛怎么判断?
这个链接锚文字就成了桥梁和参考。
关系可以理解为这样:你的网页的关键词VS(相关度判断,设为A)→ 锚文字(为链向你的网页上的锚文字)←(相关度判断,设为B)他的网页的关键词。
PS:判断A和B的方法,参考第一部分:你的网页和你网页中的内容相关性,在蜘蛛程序中的判断。
A和B得出之后,进行对比,差值在一定范围内,蜘蛛会有个等级标准(人为设定)。比如A和B差10%以内,为相关度最高,2个网页权重增加,增加为一个权数的算式结果(可能只是对网页的质量有影响,排名的影响不太清楚,待观察);10%-15%........等等,我就不写了。
友情链接:
涉及到2个页面上的锚文字,方法大同小异。
你的网页的关键词VS(相关度判断,设为A)→ 锚文字(其中一个网页上的锚文字)←(相关度判断,设为B)他的网页的关键词
你的网页的关键词VS(相关度判断,设为C)→ 锚文字(另一个网页上的锚文字)←(相关度判断,设为D)他的网页的关键词
A和B对比得出一个权数算式结果:E ;
C和D对比得出一个权数算式结果:F
E和F最后进行对比,得出最后的权数算式结果。
从而判断2个网页在交换链接中,2个网页的相关性判断。
以上情况适合于单向的链接相关性判断,和友情链接相关性判断。
本人经验,如有错误,欢迎大家拍砖指正!