金俊:首先感谢大家的光临。今天是国际万维网2008的大会,是国际上规格非常高的会议,也是第一次在中国大陆举办。能够使国际一流的大会,学术讨论型的大会,在北京召开,我们微软亚洲研究院,作为白金赞助单位之一,也做了很多的努力,下面洪小文院长会介绍很多的细节。我们想借今天这个机会为大家介绍一下万维网,介绍一下微软亚洲研究院在互联网方面做的一些前沿的研究,也想谈一谈和各位的合作。
我简单介绍一下今天的嘉宾。我叫金俊,主要是负责微软亚洲研究院对内对外的沟通。这位是洪小文院长,大家可能看过洪院长的简历,他和研究院的很多研究员背景不同,他原来在微软总部做过很多年的产品开发。洪院长是语音识别方面的专家。还有一位是马维英博士,微软亚洲研究院副院长。他主要负责互联网搜索与数据挖掘,还有在线广告方面的工作,跟今天这个大会的主题是非常贴切的。
关于研究院
洪小文:首先欢迎大家今天来到这里。
我想今天大家来非常大的意义就是微软亚洲研究院10周年,也希望再一次跟大家介绍最新的情况。同时今天也是第17届国际万维网大会第一次在中国大陆举办。我是大会的副主席,马维英是程序主席,我们(微软亚洲研究院)也是白金赞助商,参与了大会中的许多活动。我们也很高兴把万维网大会介绍到中国大陆来,互联网对在座的每一个人都有很重大的意义。
在这里给大家介绍一般人很关心的话题,就是互联网的创新跟商业机会。这也是之前我的报告中的一个内容。首先我们对微软的情况做个介绍,我们微软有1%的人在研究院,微软有超过8万的员工,所以我们大概有八九百人。我们有6个研究院,今年11月是微软亚洲研究院建院10周年。
我们要特别跟大家说的是,今年在美国的麻省剑桥即将成立新的研究院。
金俊:就是哈佛大学所在的城,也叫麻省剑桥城,这和英国的剑桥是完全不同的地方。今年微软研究院在哈佛大学所在的剑桥小城也建了一个研究院的分院。
洪小文:今年是微软亚洲研究院建院10周年,所以我们有一系列的活动。大家看到这个标志,四个颜色一定就是微软亚洲研究院10周年的活动,我们非常的兴奋和振奋的迎接这10周年。
今天亚洲研究院有超过350个研究员和工程师,我们多年来培养了2500名研究生,我们也发表很多论文,等一下会向大家一一介绍。
我们的研究领域。我们根据10多年做的东西,和未来10年的展望,归纳成比较新的研究领域。其实很多研究项目可以归成不同种类,我们在这里也希望由这些研究领域来传达我们对未来10年的一些科技发展的看法和预测。所以这是我们新的研究领域归类方法。
第一个叫自然用户界面。我本人20多年来在这方面花了很多心血。主要研究语音的,用笔的,或者手势的,就是人和人互动最自然的方式能不能用在电脑上。这在未来10年是非常有机会实现的。一个是所谓的计算机,或者是计算器越变越小,就像手机那样,当手机变得很小的时候用键盘和鼠标就不可以了。还有就是东西越变越大,例如屏幕变得越来越大,所以我想用语言的方式,手势的方式,手写的方式是非常非常重要的领域。
新一代的多媒体是什么样的呢,过去10年我们在多媒体方面做了很多工作,像计算机视觉,计算机图形等等。我们为微软产品也做了很多贡献,我想很多媒体都看到了我们在多媒体上做的东西,当然未来10年我们会把它做得更精益求精。
一个新的领域,就是常常会被大家拿出来讲。Google叫做云端计算,这被我们叫做以数字为中心的计算,因为提到云端计算,大家想到的是用户看得到用户的一些应用,像电子邮件,像搜索等等。那么还有一些大家看不到,像企业内部都有大型的数据和资料,微软也是其中之一,怎么样把数据做分析,提取有用的信息,最后变成有价值的东西,这是每个公司花重金实现的。而且是非常需要的一个计算机的平台,能够让他们做这样分析的工作,所以叫以数字为中心的计算。那么微软亚洲研究院在过去几年,跟未来10年会在这方面做努力。这方面是我们看重,而且将做更多更多研究的重要项目。
在以数字为中心计算方面另外一个领域,也是今天常被大家报道,竞争非常激烈的互联网搜索和广告。大家想想微软要花450亿美金跟雅虎结为“亲家”这么一个动作,说明这方面的竞争是非常激烈的,所以前任沈院长在升任公司高级副总裁的时候,今天也在负责搜索产品开发的工作。所以在这方面我们肯定是要继续增长更多的力度。
最后一个是非常有趣的,我们讲这么多东西,其实计算机有很多基础的研究是很基本的,包括计算机原理,包括大概在一年半两年前提出的叫做研究2.0等。有很多基础的科学研究,不管其他的领域怎么变,或者有什么新的领域,有很多科技和研究一直都是非常重要的。这些东西从一个角度看,也可以说是计算机研究的根本,我们也会投入更多的人力跟资源把这个基础打好,把基础打好以后,不管什么领域都希望做得更好,这是我们很重要的努力方向。
要跟大家特别提到一个搜索技术中心,因为今天亚洲研究院里面有将近130到150个工程师在搜索技术中心,他们不是研究员,他们是工程师,就是把东西实现出来。两年前成立,搜索技术跟传统的软件比较不一样,传统的软件需要三五年,而搜索技术每个星期要翻新,每个月要翻新,甚至每天都要翻新,所以我们想把研究员和工程师放在一起,我们会很快的把东西从一个想法,从一个研究以最快的时间落实到用户想用的东西,而且经过不断的更新,最后变成人们所依赖的技术,那么我们会在竞争上拥有很大的优势,所以我们成立了搜索技术中心。我们不仅负责中国,日本,韩国的MSN和Live Search的搜索,同时我们还负责一些基础的搜索技术,就是不分语言的搜索技术,比如说互联网的技术平台,还有关于产品,关于多媒体资料数字搜索。不但在我们这里开发,整个研究都在我们这边做,而且这是很特殊的地方,所以为什么之前我讲到的,搜索和广告的领域是我们很重要的领域。
关于国际万维网大会
那么接着我想花短短的时间和大家介绍国际万维网大会。那么万维网,或者是互联网顾名思义就是和Internet有关的,94年成立到现在已经是第17届了,不仅是一流的学术会议,而且在互联网上面重要的企业都不会放过一年一次的盛会,所以大家耳熟能详的互联网公司,不管是国内的还是国际的都会在这边出现。那么论文也是一样的,各路精英好汉都会在这儿发表论文的。那么浏览器的第一代创始人,Tim Bertner-Lee,有人叫他“爵士”,第一个浏览器是他在89年,在欧洲做物理研究的时候,为了跟人家交换研究成果所做的,他成立了W3C的国际标准,这个大会他也是起始人之一。
这个大会第一次在中国大陆举办,我们也非常的高兴,北航的常务副校长做执行主席,今年也是奥运年,因为是奥运年我们要做很多协调沟通的工作,但是我们也非常非常的兴奋,同时我们的主题和奥运相关的,就是“同一个世界,同一个互联网”说明大家是连在一起的。讨论的主题呢含概了和互联网所有相关的内容,比如说浏览器,数据挖掘,移动性,保密,搜索,安全,社交网络,WEB2.0等等各个东西。通常论文的审查非常的严格,马维英博士在负责论文方面,程序委员会的程序主席,就是负责论文,审查论文,在888篇里面只有100篇被收录,比例只有12,13。微软是最高的赞助商,是白金赞助商。
我们从2001年开始,微软亚洲研究院有28篇文章获选,世界上相关的研究单位算非常非常的多,像去年我们有6篇,前年是4篇,今年我们有7篇,我在吃饭的时候遇到第8篇的作者,最后搞清楚了我们真的有8篇。因为这个同学也是复旦的同学,大部分前期工作在复旦做,最后在我们这个地方做了最后的工作,而且他的论文上面确实有亚洲研究院。我为什么非常在乎这个8,今天大家所熟悉的,我们在国际图形学大会上,我们今年也是8篇。将在暑假有一个搜索会议,是国际最高的搜索会议我们也是8篇,我和我的老板报告,我们中国人喜欢8,今年2008年,奥运会8月8日,晚上8点,8分,8秒,我觉得今天的责任就是努力的制造一堆8,我的老板说非常好。他用的英文叫做That’s Great。他不这么写,他写Gr8t,他们念一下很有意思。
关于《互联网创新与商业机会》报告
很快的时间和大家介绍,我刚刚在之前做的报告,我想很快的把它浓缩成一个简要的内容。这个PPT是我们对过去40年科技的一个回顾,一些重要的事件,不管是硬件的,软件的,互联网的,像我刚刚提到的Tim Bernet-Lee,1991年做核研究的,在做研究的过程中意外的发明浏览器,当然到今天互联网已经无所不在了。
那么硬件上来讲的话呢,我想在座的都是年轻人,我上学的时候用的机器是这样的,一间房间只有一台机器,现在个人电脑已经很小了。但是我们以前的机房今天还是有的,今天也有机房,但是今天和以前不一样的地方就是说,今天一个机房里面有上千上万的机器,因为每一层就是刀片服务器,所以每一个像冰箱一样的东西呢,通常可以放30个刀片服务器,两面可以放60个,所以这样一个房间里面就可以有上千台的机器,上万台的机器。去年SUN公司,因为除了这些机器以外还需要冷气,要不然会烧坏的,然后这里面还需要UPS,是什么意思呢,因为做这些互联网的服务必须要24×7,就是说每天要Run24小时,每个星期要Run7天,所以必须要一大堆电池在等着用,所以这需要很大的地方放电池。这最好放一个集装箱,人家说你不要用机房了,只要有一个空地,然后把东西往那儿一摆,就可以用了,如果机器不能用了,就打电话给公司,让公司拿一个新的集装箱拿来用就可以了。就像今天计算机坏了没有人修,直接打电话给计算机公司来修一样的道理。
那么还有,软件就是服务,服务是什么,服务像家里的自来水,水龙头一打开水就流出来了,其实这个水从雨下来,经过一大堆过滤,通过管子到你们家非常的麻烦的,但是这些你都不用管,你一打开水就来了。这就叫做软件及时服务,这里面要通过很多很多的软件,这比软件上买一个软件,需要把它装在机器上,有时候要打打补丁,希望这些服务就像家里的水龙头一样,一打开就有水。
那么互联网之所以伟大,之所以重要,我想第一个最重要的就是最大计算平台。把东西要做的预算在很多机器上跑,当然会跑得很快,那么互联网肯定是最大的计算机平台,有史以来最大。大家都听说过网格,那从来没有比互联网更大的网格。
互联网也是最大的数据库,有些资料肯定是最宝贵的,把这些东西串起来,肯定是最大的分布式的资料库。
互联网以前常常被人家忽略,现在大家也比较理解,它是最大的社区网络,因为每个机器前面都有一个人,那么互联网把人串起来,肯定是有史以来最大的网络,而且这个网络打破了所有的国界,打破所有的种族这些东西。所以可以很轻易的和一个远在非洲的,从来没有见过的人交谈,这是互联网可以做到的事情,那么在商业上也提供了最有活力的市场。
下面我讲一下Web2.0,这个大家都听说过,我就不多说了。
下面是互联网经济,这就是长尾效应,传统上我们认为主流是重要的,我今天卖书,我就卖最畅销的10本书,这听起来很合理,我有一个书店,我要卖最畅销的书,卖得比较多。但是在互联网上就不一样了,原因是这样的,你知道最畅销的10本书,我也知道最畅销的10本书,你卖我也卖,最后都降价,杀得血本无归,都赔钱,那么长尾效应我们叫红海,就是大家杀的最后血流成河,最后大家都死了。那么大家听过蓝海效应,就是真正的战场,真正的机会在Tail(尾巴),Tail(尾巴)就是,虽然今天我也看畅销书,但我保证每一个人有喜好,这听音乐也一样,看书也一样,有一些书不一定大家喜欢,有一些音乐你喜欢不一定大家都喜欢,所以我常常讲的理论就是每一个人都有自己的爱好。那么今天的互联网一定要照顾到您的爱好,如果说有一个店号称要买的书,从畅销书到任何一方面都有卖,那这个店一定是每个人的首选,因为不希望说今天买这个书要买这里,买其他的要到那个店,以前是做不到的,因为我要买一个店,要卖全世界所有的书,这是不可能的,因为你的物理空间不允许你卖所有的书,这样最后一本书一年只卖掉一本,你放在那里最后您是亏了。但是为什么互联网可以做到长尾呢,因为今天是一个虚的空间,今天不要去库藏,您今天说要哪本书,我收了你的钱我才到出版商,出版商甚至都不用印,只要有人买才能印,但是这些以前是做不到的,所以长尾效应很重要,我们要打破以前的规矩,主流的东西是很容易做的,但是难就难在照顾每个人的爱好。所以所有会成功的东西都会照顾这个长尾,搜索也是一样的,如果大家觉得这个搜索引擎非常好,这个搜索引擎一定会照顾很多人的爱好一样。
那么从互联网的长尾经济事实上就到了这一点,我可以跟您说,我有全世界所有的书,所有的音乐,但是这空说无评,你必须要让人家知道你真的有那本书,比如说把那个书打进去,你真的有卖,所以这个搜索很重要,搜索和长尾效应是完全相互呼应的。
那么广告为什么重要呢,广告重要也很简单,跟长尾效应结合起来更加的重要。我们说最好的商业架构就是说今天买方和卖方直接碰头了,不用透过大盘,小盘,中盘,还有经销商,假如我是在浙江卖鞋,我要把鞋卖到意大利去,我先要把鞋运到港口,这个港口运到意大利,意大利通过大盘,中盘,小盘,最后卖到消费者手里,那么这样很多道工序的话,我赚得很少,我如果可以直接找到意大利的买主的话,我可以赚更多的钱,也可以卖比较便宜的价钱,那么今天广告就提供这个,尤其对于长尾效应来讲的话,今天互联网有一大堆小店,今天在家里大家都可以自己开一个网上商店,今天怎么样让别人知道你在卖鞋,事实上做的就是广告。那这些所谓的搜索提供商抽取一些很少很少的钱,因为它能够帮卖者找到买者的话,你也愿意付给互联网一点一点钱,所以为什么搜索和广告这么重要,而搜索和广告的结合还有长尾效应都非常的相关。我想我很快的把45分钟的演讲缩短到3-5分钟,以上就是我想讲的。下面进入下一个提问环节。