此文将介绍如何让你的网站成为google搜索中的焦点,如果你是一名网站技术人员,读完此文你将有所收获。
一、让google找倒你
如果你搜索某类关键词,出现关键词的前几名网页并非如SOHU,SINA,163等门户网站,而是其他专业性突出的站点,甚至一些你从未听说过得网站,他的排名却一直排在大型门户网站前面,或者该站点的域名为.org,.edu等而非商业公司.com。
他们是如何做到的?
1、连接的重要性
假设某人发表了某篇优秀文章,而其他人在他们的文章中多次引用了这篇优秀文章的内容,或者提到了这篇文章,那我们可以认为这篇优秀文章,在某个领域就是权威。这就是google对网页排名的中心思想,谁是权威,谁是焦点,谁就排名在第一位。
如果某个网站在sohu的首页做了一个首页的友情连接,那么很快该网站的首页里面的内容关键词在google里面得到大幅度的提升(即使没有人点击这个连接,也会有很大的效果)。以此类推,在众多知名网站上面做了友情连接,你的网站将很快推广出去。我并不是鼓励读者去到这类门户网站上面去做广告,只是想说明:连接就是一切。
sohu至少经营了6年以上,google对他的许多网页评价都很高,目前sohu的首页评价为7/10,可以说,sohu就相当于一个权威。而在这个权威里面,引用了你的网站(增加你的友情连接),那么google会认为,权威所引用的内容,一定不是赝品,因此google也会因此会提升对你网页评价。
反之,如果你在一个名不见传的网站(google对改网页评价较低)做了友情连接,那么效果几乎等于没有。因为google排名的思想是权威第一,其他的就放到后面去吧。
推荐方法:
大量的与其他网站交换连接,最好是google评价较高的网页;
查找网站的死连接,因为他们将会破坏网站在goolge心中的形象;
增强网页内容的质量,因为他们将会给你得网站带来更多的点击率和引用率,因此而提升google对改网页的评价。
注:Google对网页的评价,你需要下载google工具条,上面的pagerank则表示评价值。
2、让google认识你
即使你的网页做了大量高质量的友情连接,为大多数权威引用,可是如果你的网页在设计中没有处理好某些技术细节,google可能无法认识你,因此而浪费你的资源。
需要注意的几点:
网页的标题。网页的标题就相当于一个人的名字一样,如果你的网页没有title字段,那么goolge将很难识别;
网页的关键词、描述。虽到目前这两项逐渐被google所忽视,但他们依然有所价值,你最好在网页的keywords,description字段中输入该网页关键词以及描述。
尽量少的使用flash动画、图片。如果你的连接以flash或者图片的形式出现,那google将很难识别出里面连接,也就是说等于白费。虽然google对外声称可以识别,不过实际效果并不理想。因此网页里面的连接最好是文字连接,如果你为了美化你的网页而必须使用flash或者图片,那么建议你在做了flash或者图片之后,在网页的其他地方在做一个文字连接。
连接的正确性。排除死连接,这一点必须注意;另外,如果该网页属于动态网页,比如news.asp?id=95,或者其他语言的,如:news.jsp?id=95,new.do?id=95等等,这些网页也很难被google识别,虽然google声称他能快速的识别这些动态网页,但实际效果并不理想,因此,恶贼钟林强烈建议将所有动态网页转换成静态网页html(别砸,别砸我,鸡蛋好几万块钱一吨)。当然,并不是让你将网页直接改成html格式,因为这样的工作量是无法承受的,apache和iis服务器都有一个re_write的模块可以为你解决自动转换,这一点我将在下面做详细介绍。
二、google关注你网站站设计中的细节
1、建立网站地图。
网站地图有两个好处,一是方便读者进行网站导航,二是方便google搜索你的网页。
google在对你网站搜索的时候,有一个入口,通常是你网站的首页,然后根据网站首页上面的连接进行逐个的搜寻,然后将搜寻中正确的结果加到他的数据库里面。因此网站需要一个能够最大容纳你网站所有网页的连接群,最好的方法是做一个网站地图,在里面输入你网站主要栏目的连接地址。而google不会主动去搜寻你网站一个名叫sitemap.html的文件,因此恶贼强烈建议将网站地图的连接代码拷贝到首页,这样goolge在搜索首页的过程中将会一次性的读取你网站大部分的连接。
另外值得注意的是,如果你的首页是一个flash,或者一个图片,goolge很可能无法正确搜索你的网站连接,因此网站的首页要尽量多的作连接,但连接形式最好是文字连接。
2、关于re_write
目前较为普遍的动态网页包括asp,php,jsp,shtml,jhtml,cgi......甚至还有一些自己定义的,比如:aspx,do,index,hello等等。表现形式为:news.asp?id=95。恶贼钟林建议读者通过re_write将其转换成news/95.html,以便于google对改网页的识别。
re_write是iis里的一个模块,你可以从http://www.95ren.com/soft/re_write.zip下载,里面有相关安装说明。
当需要将news.jsp?id=95的映射成news/95.html时,只需设置httpd.ini文件:
RewriteRule /news/(\d+)\.html /news\.jsp\?id=$1 [N,I]
这样就把 /news/95.html 这样的请求映射成了 /news.jsp?id=95
然后你在连接处这样写:95新闻。
如果你的新闻是通过数据库循环读取出来的,那么写法是:
while(rs.next())
{
String id = (String)rs.getString('id');
out.print(');
out.print('95新闻');
out.print(');
}
如果你在处理数据翻页,那么写法是:
More__.html(注:page是翻页页数,type是数据类型)
表现形式:More_1_95.html
如果翻下一页,则为:More_2_95.html,继续下一页的循环,则是More_3_95.html,以此类推。
不过你需要在httpd.ini文件中增加以下代码:
RewriteRule /More_(\d+)_(\d+)\.html /jsp/more\.jsp\?page=$1&type=$2 [N,I]
如果你的动态程序有多个参数需要传递,那么就增加多个(\d+)即可,如下:
RewriteRule /More_(\d+)_(\d+)_(\d+)\.html /jsp/more\.jsp\?page=$1&type=$2&type2=$3 [N,I]
可以参考我的网站“朝九晚五”http://www.95ren.com 里面的翻页处理表现形式是:
More_1_95.html
三、加入google
1、登录网站
到google去登记你的网站,网址是:http://www.google.com/intl/zh-CN/add_url.html。当然,google不会让任意的网站登录,你的网站首页必须能够打开,并且内容必须健康,且内容不能太少,否则google将不予通过。
即使google通过了你的登记请求,他也不会通知你,你也无法立刻知道是否通过了。一般在1个月之内就会知道答案,因为google对于新站的审核、登记,不会立即生效。但是我们可以通过这样的方法来确定你的网站是否已经通过登记:
到google的搜索框内输入: site:www.你的网址.com
如果查询结果为0,则表示google尚未登记你的网站,或:注意,或者是你的首页出现异常,或者是你的首页使用了框架,或者是你的首页没有标题、关键词,或者是你的首页的内容太少,这些因素将导致你的网页无法被google识别,即使你已经通过了登记审核。
2、验证你的网页是否被google收录
直接在goolge的搜索框之内输入你的网页的网址,如果查询结果为0,则表示并未被收录
3、验证你的网页是否被google更新
google会在1个月之内在他的数据库里面新你的网站信息,当然,如果google对你的网页评价高于4,那么这个时间将会缩短到1个星期。如果你安装了google的工具条,你可以使用“缓存的网页快照“功能,来查询目前google收录该网页的过期信息。
注:google更新的首页的时间是1-3天,网站内的其他网页是1-36天。
四、google的喜好与厌恶
google也有发脾气的时候,如果你的网站首页或者其他网页打不开,或者你的网页内有不健康的内容,google会降低对他们的评价,如果网页的评价一直在下降,最终google会在他的数据库里删除你的网站信息。
google不喜欢框架,如果你的网页使用了框架,google将无视他的存在,而拒绝将改网页的信息加入数据库。google喜欢html文件,因此所有信息的搜索都以html为先,而那些动态网页asp,php,jsp甚至一些自定义的do,action,hello等都统统排在后面。 google不喜欢js,虽然大家都用它来读取数据,不过既然google讨厌js,我们也没办法,因为js里面的内容是无法被google识别的,因此如果你坚持要使用js,那js里面最好不要存放重要信息。
五、google的站内搜索
默认google搜索框是搜索互联网(www)上面所有的内容,如果你的网站已经被google收录了,那么你可以做一个google站内搜索。就是说在google数据库中搜索所有你的网站的信息。比如你输入了你网站内的一个关键词,使用google的站内搜索的搜索功能,将会在goolge出现你网站内所有与关键词有关的网页。
如果你的网站已经被google收录,并且运营情况良好,建议你可以做一个google的站内搜索功能。恶贼钟林提供一个简单的方法来实现这一个功能,将以下代码拷贝到你的网页当中即可:
<!-- SiteSearch Google -->
<form method=get action="http://www.google.com/search">
<table bgcolor="#FFFFFF"><tr><td>
<a href=http://www.google.com/>
<img src=http://www.google.com/logos/Logo_40wht.gif border="0" alt="Google"></a>
</td>
<td>
<input type=text name=q size=31 maxlength=255 value="">
<input type=hidden name=ie value=GB2312>
<input type=hidden name=oe value=GB2312>
<input type=hidden name=hl value=zh-CN>
<input type=submit name=btnG value="Google 搜索">
<font size=-1>
<input type=hidden name=domains value="www.webjx.com"><br>
<input type=radio name=sitesearch value=""> 搜索WWW
<input type=radio name=sitesearch value=www.webjx.com checked> www.webjx.com
</font>
</td></tr></table>
</form>
<!-- SiteSearch Google -->
关键词:
拷贝代码时,请将value='www.95ren.com'中的网址,改成你的网址,不需要加http://,直接写www.你的网址.com即可。
你可以看到form表单是提交给我的网站'朝九晚五'的,我网站的程序在将你输入的信息提交给google,最后google将搜索出来的信息显示出来。如果google并没有搜索出你输入的关键词的相关信息,则表示google并没有将你网站的改关键词加入到他的数据库中,也可能是你的的网站本身就没有登录到google的数据库,还有一种可能是,google搜索的是1-30天以前的信息,在这30天之内你所添加的信息,google尚未来的及将该信息加入到他的数据库之内。
六、影响排名的其他因素
影响排名的另外一个重要因素就是你网页的时间,如果网页的生成时间越近,那么排名就会越在前面(注:这不是唯一的因素)。不过百度搜索(baidu.com)对时间因素看的非常重要,即使goolge 对改网页的评价低于其他网页,但如果网页的时间是最近的,那将显示在百度的第一位。
首页自动更新,不是首页数据自动更新,而是整个文件自动更新。如果你的首页是采用asp,php,jsp,通过读取数据库来实现自动更新,那这只能算是首页的数据更新了,而不是首页文件更新,google和百度看的是首页文件的更新时间。
这里我介绍一个让网站首页永远是最新的方法,用java自动生成首页:
步骤1、将你首页的所有数据读取出来,通过io存放起来。如果你的首页需要读取数据库纪录,你可以在此之前通过读取sql将数据库信息读取出来,然后通过io控制写入文本html。
步骤2、合成你首页所需要的所有数据,包括图片、文字、动画、js脚本等等,通过io将这些数据合成为index.html。
以上两个步骤可以实现首页的更新,但不是时时自动更新。若要自动更新,你可以触发一个事件,当事件触发时,则实现步骤1和步骤2。我的站点“朝九晚五”的触发事件是:一旦网站有新的文章发布时,则触发首页更新事件。而站点每天都有很多新的文章发布,这就表示网站首页每天都会更新,其首页文件的时间永远是最新的。