微软亚洲研究院成立于1998年11月,过去的十年与中国IT产业一起迅速成长,如今已经发展成为微软在海外最大的研究机构,拥有近千项专利,260多项技术转化,在国际著名学术会议和期刊上累计发表论文3000余篇,孵化出微软亚洲工程院、搜索技术中心等重要机构,并且同学术界、产业界以及政府部门密切合作,共同致力于提升中国及亚太地区的创新水平和人才培养。正如比尔•盖茨在专门为微软亚洲研究院十周年录制的录像中所说,“微软亚洲研究院的发展超出了我预期的上限,为我们的技术知识和产品储备做出了巨大贡献,同时还给整整一代计算机研究者带来了积极的影响”。
“在过去的十年中,微软亚洲研究院始终致力于发展成为一个领航计算机技术未来发展,将梦想变为现实的地方。”微软亚洲研究院院长洪小文博士表示,“过去的十年是致力于创新、合作和人才培养的十年。经过与学术界、教育界和产业界十年的合作,我们不仅在研究方面做出了许多突破,还培养了一批非常优秀的年轻研究人员。此外,最近两年里我们已经有20项专利技术授权给其它公司,让这些业界伙伴的发展如虎添翼。可以说,中国研究人员占95%的微软亚洲研究院所取得的成绩,真正体现了中国的自主创新。”
与亚太区高校的合作是微软亚洲研究院的重要使命之一。十年来,微软亚洲研究院与大中华地区的十所高校建立了联合实验室,“明日之星”实习生项目累计接待了3000多名来自世界各地的实习生,超过33万名学生受益于微软亚洲研究院与高校共同开展的各种合作项目。本届创新日的另一大亮点就是展示了微软亚洲研究院与亚太区六所高校和科研机构的联合研究成果:同北京大学合作研究的“因果网络的结构学习和干预情况下的预测”;同中国科学院国家天文台合作研究的“微软万维天文望远镜”以及同日本和歌山大学合作研究的“空气纸”等项目都在亚太地区相关领域研究居领先地位。微软亚洲研究院技术:
地图人生:在图上拓展你的人生

地图人生(GeoLife)是一个基于GPS轨迹数据和电子地图的智能系统。它不仅是一个可帮助个人管理、可视化和理解自己人生经历的网站,更是一个能方便大家用个人的历史轨迹去分享生活经历并构建人际网络的平台。
通过挖掘大众数据,地图人生可向用户推荐一个地域中的热点地区、经典旅行线路和“专业”玩家。通过理解个人数据,地图人生能够计算人与人之间的相似性,从而为用户提供个性化的朋友及旅行地点推荐。
总之,拥有地图人生,用户不但可更轻松地回忆过去的往事并更直观地与他人分享经历,而且能拓宽自己的朋友圈和旅行知识,从而更高效规划未来的行程。识别空中手书


即使不是科幻迷,即使不是游戏迷,有很多很多人也会憧憬科幻般的生活。当人在空中对着机器比划的时候,已经不再是“对牛弹琴”,我们的研究工作使得计算机、智能家电、游戏机能够认识你所比划的文字。
我们这个演示的主要目的是针对两个应用场景来研究用户的体验:a,在交互式游戏环境下,用户需要输入一些文字(如名字,答案),甚至符号(解密类游戏)以获取不同的游戏体验;b,在可联网设备上,如网络电视(IPTV),Xbox,甚至智能家电,需要输入文字信息例如在网络电视上搜索视频,Xbox上搜索游戏动画等等。这两种场景在未来会是普遍的需求。
针对这些场景,我们设计了两种解决方案来做演示:a,最廉价的方式是使用一个网络摄像头来观察用户手的运动;b,使用一种带有被称作“陀螺仪”和“加速度仪”的传感器的设备来捕捉用户手的运动。当用户手的运动被捕捉到之后,对其进行补偿,增强后,我们的手写识别模块就能认出用户在空中写的文字。
在这个演示中你可以输入中日韩文,数字,英文来体验效果。基于图像竞价的在线广告系统

在目前的在线广告系统中,广告商与用户的相关性很大程度上是由关键字匹配来决定的。在点击付费广告(pay-per-click)模型里,广告商首先会指定一些可能触发广告的关键词和他们愿意为此支付的最大金额。当用户输入查询词,浏览网页或在其它应用中与文字交互时,广告系统会基于查询词或网页中的文本来选择并显示相关的广告信息。尽管在判断相关性时我们也可以考虑其它信息,例如地理位置,当前时间和用户兴趣等,文本理解仍然是这里最重要的技术。
在这个演示中,我们将展示一个基于图像竞价的在线广告系统。在我们的系统中,广告商购买图像,而不是关键字。例如一个玩具销售商可以购买电影海报的图像,而一家餐馆可以购买一本烹饪杂志的封面,用户则会依据他们最近读过或使用过的图像内容收到相关的广告。这个系统由广告编辑工具,图像内容理解,图像匹配和用户理解等模块组成。我们的系统主要适用于频繁输入或使用图像的应用服务,例如多媒体短消息服务和基于内容的图像检索服务等。评论搜索:从草根的视角理解万维网

随着万维网的发展,草根用户发挥着越来越重要的作用。他们通过社区,博客,即时通讯软件等网络工具口口相传,广泛联系。同时,草根用户贡献大量的内容数据到万维网,包括对各种事物的评论。这些评论数据包含用户的知识,规模大,更新速度快,如何有效的管理和使用它们需要进行一系列的研究工作。评论搜索项目试图对草根用户的评论数据进行收集、存储和有效的管理。基于对评论数据的分析和挖掘,理解用户的观点和需求,为更多万维网用户的消费和购买行为提供帮助,为厂家改进产品和服务提供指导。区别于以前对用户社交网络的分析研究,该项目更重视对文本评论数据的分析和处理。我们的评论搜索演示系统提供以下功能:
评论分类和属性识别:用户可以基于评论的类别、强度以及持相同观点的用户数量或者比例浏览评论数据。用户也可以基于用户评论对象的属性浏览评论数据。
产品排序和评论排序:基于发表评论的用户、评论数据的特征等信息智能的对评论数据排序;允许用户基于感兴趣的对象属性对评论数据选择和排序;基于若干用户的评论对产品进行排序和推荐。
一对一比较:基于用户的观点对评论对象进行比较。支持基于评论对象的属性进行比较,例如基于用户评论对两个相机的镜头进行比较。
用户满意度分析:分析具有特定地域、年龄、语言、性别属性用户的评论。理解产品和服务对于特定用户群是否成功。
评论趋势分析: 分析特定时间段内用户观点的情况和变化趋势. 例如,分析某公司发布特定产品前后用户观点变化情况。
智能的理解用户输入:支持用户在不同粒度上输入查询词。例如用户可以输入Mp3 player, Microsoft Mp3 player, zune进行查询。系统可以理解用户的需求并提供整理好的搜索结果。人立方关系搜索

人立方关系搜索以人为中心,自动地将互联网上的所有信息都按照“人”进行重新整合,关系的脉络、最新的资讯、历史的点滴都被融合在人立方之中。有人的地方就有关系,在网络信息的基础上,展现众人之间的关系,让信息立体化,这就是人立方。人立方突破传统搜索引擎的呈现模式,提供了一种新的浏览网络信息的体验:以人与人之间的关系为纽带,将埋藏在网络信息海洋中的“人”的信息连接汇总并自动绘制众人之间的社会关系图。
在微软技术节上,英文版人立方(EntityCube)首次亮相。我们将演示中英文版人立方的以下功能:
人立方关系图
人物信息汇总和关系搜索
六度连连看
时间轴上的关系搜索
资讯人气榜记事空间:增强现实记事贴

人们希望将来可以很方便的在不同地点获得同样的媒体和信息,并且是跨越不同的设备上获得-从PC到手机,从投影仪到头戴式显示器。我们怎样能为用户提供一致的和方便易行的方式来让他们和对他们而言很重要的信息和媒体(提醒,社会和新闻,书签)进行交互?我们怎样能够帮助用户自然的从当前的工作中心(如看电影,写了一份文件,浏览网页)切换走,来与这些特别意义的事情进行定期交互互动?
我们的项目正在探讨与任何类型的数字信息或媒体进行互动的新的方式,它显示为“记事贴”状图标,悬浮在环绕用户的三维空间中。这些记事贴只有通过“增强现实”才看的见 ,用户会看到事先已被软件修改过的实际场景的视频。我们称这样的增强现实记事贴的个人媒体空间为“记事空间” 。用户通过把摄像头指向他感兴趣的方向(例如对着她的电脑显示器)并且设定他当前环境的方位地图来圈定“记事空间”的起始点,接下来,用户通过移动她的摄像头来扩展环境地图并插入事先创建好的记事贴。无论用户何时何地访问他的“记事空间” ,他都会看到在同样的相对位置有同样的记事贴,我们的项目是基于物理交互的互动方式来让用户方便的和一致的在不同设备之间交互,并支持定时的与增强现实便条进行交互(如每隔5-15分钟)-来显示那些特殊的或者正在进行的对用户而言很重要的事情(如社会网络活动)。
这个项目的主要特点是它能够利用任何的只要有摄像头和显示屏的计算设备,使用户能够建立一个丰富的“周边”信息和媒体,来帮助她的生活,工作和娱乐。这种从使用鼠标的间接浏览和整理图标的两维显示到使用摄像头在三维空间安排便条的过渡,目的是让用户感觉那些对他而言特别重要的事情总是随时随地可触的。
我们的“记事空间”概念确实是一种新的方式来思考我们如何与各种数字信息和媒体进行交互。这不仅包括文字便条,文件,应用程序快捷方式的静态排列,更是能够将各种媒体收集(如照片,专辑封面)投射到真正的三维空间,并动态的根据从社会网络,新站点和合作文件空间等等来的信息源的演变来创建和重新安排。在工作中,从电子邮件和其他处来的提醒通知可以在空间中呈现,随着摄像头的移动轻轻飘动。在家中,可以在环绕现实事物的虚拟屏幕上切换频道,可以用手机来浏览选择。无论用户处于何地,都可以通过共享的“记事空间”开展交流 。这个研究领域有许多可能性,我们才刚刚开始探讨这个方向。查颜观色:基于颜色分布的图像搜索

我们提出了一种新的互联网图像搜索方式,即基于颜色空间分布的图像搜索。这种方法提供给用户一个方便、直观的界面,用户仅仅需要简单地用鼠标粗略画出几个笔画来表达他感兴趣的图像的颜色的空间分布(颜色结构)。然后,我们的方法会自动地很快地把符合用户感兴趣的颜色结构的图像排在前面。从技术上来讲,这种方法需要同时为每个图像抽取颜色结构并且加以保存,其中抽取效率很高,1秒钟可以完成20幅图像,存储空间也很小;另外,当用户提交完感兴趣的颜色结构后,这种方法很很快把重新排序后结果呈现给用户。作为后续的工作,我们会探究基于语义结构的图像搜索。DataViz:一个大规模数据可视化工具包

DataViz是基于Silverlight技术开发的数据可视化工具包,通过该工具包用户可以快速地构建含有创新的数据可视化技术的互联网应用。
直观的数据可视化技术可以帮助用户深入了解数据并做出准确的商务决策。该工具包包含了一些针对不同类型复杂数据的创新的可视化控件,例如树状结构、网络、图状结构的数据等。
DataViz还提供了一个数据可视化应用框架,可以用来快速开发特定数据场景的应用,比如基于地理信息的媒体数据阅读程序,多维度信息分析系统等。
DataViz提供了易用、扩展性强的编程模型,通过使用Silverlight的数据绑定机制,用户可以容易的将自己的数据呈现出来;通过Silverlight的样式模板机制,用户还可以灵活的改变可视化控件的外观;通过事件订制机制,可以方便的实现控件的交互和集成。