1、 引 言,CNNIC历次《互联网调查报告》显示,搜索引擎在互联网中扮演的角色越来越重要。它日益成为一般用户的网络入口,是整个互联网的流量分发器。有关研究表明,一般网站大约有50%-80%的流量来自搜索引擎。随着大量学术论文的网络化发表,搜索引擎在提升在线学术论文网站用户浏览量和引用率中也发挥着重要作用。搜索引擎优化(Search Engine Optimization,SEO)是通过研究各类搜索引擎抓取网页、构建索引以及排列搜索结果的规律,对网站网页进行相关优化, 以提高网页的被检索率及提升网页在搜索引擎中的排名,从而提升网站最终用户浏览率的综合技术。SEO包含以下几层意思:第一是尽量提高搜索引擎对某个网站的整体评价,也就是尽可能提高网站的PR值(Page.Rank)。第二是让搜索引擎收录某网站尽可能多的网页。第三是使网站网页尽可能在搜索返回结果中进入前3名。有关研究表明,排序前3和排序4—10的网页点击率差别在100倍左右。第四是网站的网页要么覆盖少量热门高频搜索词,从而带来单个检索词的高搜索量;要么覆盖尽可能多的低频搜索词,从而达到总量最大。第五是尽量让对自己网站持正面态度或中.立态度的网页排前面,持负面态度的网页排后面,在前10条关于本网站的返回结果中内容呈现出最大可能的多样性。由于搜索引擎检索结果排名一般由云计算机服务器根据超链分析排名算法自动生成,一般而言用户无法直接控制百度和Google的排名。但是,用户可以通过优化自己的网页,从而问接地去影响上述五个方面。这就是SEO的精髓。只有搜索引擎认为好的网站网页,才能最终带来高流量,有了高流量,加之有一定的质量保证,才能提升论文网站所发表论文的引用率。
2 、SEO的一般规律在SEO中涉及网站和网页的四个相关因素:网站宏观特性、网页内容、网站外部链接和用户体验。网站宏观特性主要包括网页的动态性和网站的独特性。动态网页更新较为灵活,但是不便于搜索引擎检索。在空间允许的情况下,应尽量将整站转化为静态网页。网站的独特性也非常重要。大量复制拷贝的网页将极大地降低对网站的评价。笔者的实验表明,搜索引擎收录某网站大量网页后,会启动相似性检测引擎,并将重复网页剔除出收录目录数据库。对于每一个网页而言,内部因素主要是关键词密度。通常人们可能会误解,某个网页关于某个关键词的量越大,就越容易排在前面。实际上,关键词密度一般在4%一7%为宜。太多了,搜索引擎会认为该网页是作弊网页;而太少了,则认为相关度不够。网站外部凶素主要是链接的多少和重要与否。超链分析就是通过分析链接网站的多少来评价被链接网站的质量。这保证在搜索时越受用户欢迎的内容排名越靠前。影响PageRank的三个因子分别是反向链接数、反向链接页面的PageRank,以及反向链接页面中的正向链接数。来自重要网站的大量外部链接对提升网站的排名至关重要。而用户体验将在持续不断的排名过程中占据很大权重。即使某个链接排名第一,但由于相关性太差没有人点击,导致大部分人点击第二条,这样也会导致搜索引擎将第二条提升至第一。除此之外,大约还有百种影响排名的因素,比较重要的有:关键词在URL、header等网页元素中的使用,内部链接和外部链接中关键词的使用,网页大小,网页新鲜感,链接新鲜感,更新频率,文本主题,网站规模和权威性,网站历史等。影响排名的负面因素主要有:
88关键词堆积、网站内容更新过频、过度使用JavaScript、图片集中、过度优化、链接不当、重定向、多网站间的过度互联、Flash、Frame、透明文字、HTML错误等。
3、 实证分析本文使用的分析工具主要是笔者开发的ROSTSEO分析工具以及相关网站。选取“论文”为搜索词,对返回结果排名前九的网站以及“中国科技论文在线”(返回结果排序未进入前100名)进行数据统计和分析。这10个网站具有一般在线论文类网站的特点,有一定代表性。我们收集这10个网站的全球网站排名、网站流量和搜索引擎收录情况等相关数据见相关表格。从 卜述排名来看,“中国科技论文在线”在搜索引擎收录的论文类网站中排名居中,但是流量和第一、二名差距很大。凡在搜索引擎中排名靠前必能攫取超额流量。以这10个网站的日均流量作为整体,前三名网站占据了大约79.1%的流量份额,而“中国科技论文在线”大约占2.1%。对前三名网站的研究表明,排名靠前的关键在于较为彻底的搜索引擎优化(SEO)。由于“中国科技论文在线”在以“论文”为搜索词的网页检索返回结果排名中未进入前100名。