11月17日消息,对于近期流传的“垃圾信息是搜索不公正主因”的说法,谷歌中国工程研究院副院长刘骏在谷歌黑板报上发表观点称,这是在搜索的“公正性”与“准确性”两个不同层次的事情间偷换概念,我们认为中国搜索行业最需要做的、最紧迫的事情,就是正视公正性与客观性对中国搜索行业的根本性意义,没有搜索公正性,搜索的准确性就无从谈起。
以下为谷歌中国工程研究院副院长刘骏文章全文:
这两天,互联网上出现了这样的观点:“垃圾信息是搜索不公正主因” 。
谷歌中国认为,这是在搜索的“公正性”与“准确性”两个不同层次的事情间偷换概念,我们认为中国搜索行业最需要做的、最紧迫的事情,就是正视公正性与客观性对中国搜索行业的根本性意义,没有搜索公正性,搜索的准确性就无从谈起。
或者让我们用反垃圾信息(这也只是搜索准确性的技术领域之一)来举例。
在 海洋般浩瀚的互联网世界里,任何搜索引擎都会受到垃圾乃至不良信息影响,然而这些垃圾或不良信息在不同的商业模式面前面临着两种不同的生存可能:一种是鬼鬼祟祟千方百计去骗取网民的注意力;一种是掏点小钱就能“漂白”身份登堂入室畅通无阻。对于搜索厂商而言,能否杜绝前者,只是技术问题;能否根除后者,则是价值观问题。就好比一个人,人可以有能力的不同,但所有人都必须堂堂正正。
事实上,谷歌中国相信,今天搜索行业的技术水平已远远超出了靠人工干预解决垃圾信息的初级水准。在这方面的技术研发上,谷歌从诞生第一天开始就进行积累,至今已有10年历史,而通过机器、技术手段来解决垃圾信息早就成为世界通行的法则,现实已经证明了它的成功。所以,在垃圾信息和公正性上,我们旗帜鲜明的认为:
- 不能用搜索“准确性”混淆甚至代替搜索“公正性”的概念和基础地位
- 世界反垃圾信息技术水准无时无刻不在突飞猛进,不能让反垃圾信息成为大规模人工干预搜索结果的借口
在 正式切入公正性的定义、搜索引擎的根本之前,我想讲两个故事,这两个故事都同中文搜索的公正性直接相关。这两个故事或许会让每一个致力于中文搜索技术进步的工程师感到痛心。我们不妨思索这样一个问题——如果搜索结果页面的黄金位置注定是广告,那搜索技术的创新还有什么意义?中文用户会有怎样畸形的体验?
1.迷失的中文搜索“黄金三角区”。
通常搜索引擎结果页面都有一个最最重要的黄金三角区——“搜索结果左上角”,也就是最前面的五个搜索结果,这个区域就好比一张报纸的头版头条一样珍贵和重要。用户期待在这里看到最准确的他们最需要的信息。
我 们看到一个调查报告,美国用户在他们最常使用搜索引擎的搜索结果页面上,目光主要聚焦在搜索结果的“黄金三角区”,大概用时30秒,而中国用户的目光却散落在整个页面,用时超过60秒,所谓“黄金三角区”对中文搜索居然毫无意义。这很重要的一个原因,是用户在原本的关键位置无法找到非广告内容所致,他们需要自己满屏地、甚至翻屏的辛苦寻找有用信息。合计起来,中文用户每天比美国用户在搜索上浪费超过250万小时(或者超过10万天)的时间。
2.“秦皇岛地图”的故事——搜索从第二页(才)开始。
2006 年年初,我们在做调研的时候发现了这样一个用户的故事。我们请用户搜索“秦皇岛地图”,这个用户的行为非常奇特,在进入“秦皇岛地图”的结果页面后,用户直接下拉滚动条到页面底端。我们非常奇怪,问用户为什么这样做?用户为什么根本不看第一条搜索结果?用户说“反正前面都是广告,直接看后面几页好了”。
这个回答让我们非常震惊,因为用户已经不再信任那些排名靠前的搜索结果。这是非常可悲的,中文用户的搜索从第二页开始。
由此,让我们回到最基本、也是最关键的问题上——究竟什么是搜索的公正性?
搜索公正性,就是搜索页面最宝贵的区域不由广告价码来决定而由信息本身的质量决定,在中国也许还应该加上两点补充,即保护用户对搜索结果信息的知情权和不滥用自身的市场地位。