第一时间get全球最新科技知识与数据
下载钛媒体客户端

扫描下载App

创造未来的模样

摘要: 自然用户界面、新一代多媒体、以数字为中心的计算、互联网搜索、云计算和科学基础等领域,它们在“后天”将会以一个怎样的方式演进?这些创新科技又将如何改变人们“后天”的生活、工作和娱乐?

流水声、摇橹声、号子声、集市的嘈杂喧哗声……上述场景是“走进清明上河图”沉浸式数字音画所展现的精彩片段。在位于北京中关村西区丹棱街5号的微软研发大楼一层访客中心,展示了来自微软亚洲研究院(以下简称“MSRA”)的“走进清明上河图”沉浸式数字音画展示项目。《清明上河图》通过一台高清投影机,显示在大屏幕上。更酷的是,现场的音效会随着参观者的浏览角度而改变,如果放大某个细节场景,甚至可以聆听画中人物的对话细节……前来的参观者可以观赏、倾听,领略800多年前北宋都城汴京的百姓生活。

“这是最自然的人机交互方式,它融合了多媒体标注等核心技术。”微软亚洲研究院院长洪小文博士对《商业价值》记者表示:“我们一直在进行多领域的研究,探索无限的可能性,让许多不可思议的事情成为现实。”

微软亚洲研究院被定义为“后天”的研究。在微软的3大部门中,销售部卖今天的产品——Windows 7、Office 2010等,赚“今天”的钱;产品部研发下一代产品——Windows 8,赚“明天”的钱;微软亚洲研究院做技术储备,赚“后天”的钱。

在洪小文眼中,几乎每一个现在的应用都会有“后天”的情景:“IT界令人振奋的就是高于其他行业的创新速度,每天都要不断去想‘后天’的创新。‘后天’的研究到了后天,就变成了‘今天’,所以我们一定要想得更长远。”

目前,微软亚洲研究院致力于自然用户界面、新一代多媒体、以数字为中心的计算、互联网搜索、云计算和科学基础等领域的研究。这些研究在“后天”将会以一个怎样的方式演进?这些创新科技又将如何改变人们“后天”的生活、工作和娱乐?

自然人机界面走向多通道

“自然用户界面目前应用最热的是触摸技术,主要用在手机和移动终端上,未来它会进入台式机和笔记本。”洪小文说,“手势、体感是触摸的进一步延伸,也就是我们讲的‘超距离’。微软的Xbox 360体感外设Kinect,就是在向超距离演进。微软亚洲研究院对Kinect的重要贡献之一是User Identity(用户身份识别)技术,它可根据人脸、身高、服装等信息同时识别多位玩家的身份和动作。由于大家都喜欢Kinect,微软没有理由不将它从娱乐领域推广到其他更多领域。”

今年6月,微软发布了Kinect for Windows的SDK Beta(软件开发工具包测试版),这就意味着研究者、开发工程师和发烧友们可以在Windows上做一些自然用户界面的交互,比如播放PPT时可以用手的摆动实现翻页的功能。洪小文表示:“类似于这样的远距离人机交互应用,未来5年会陆续诞生。”7月14日,微软又将Kinect技术推广到了机器人开发领域。

“多通道”也是未来交互的一种趋势。“今天大部分的人机交互停留在用鼠标、键盘,也就是用鼠标和键盘是一种方式,手势是一种方式,触摸是一种方式,这都是‘单通道’的方式。以后的人机交互,可以手势、语言、鼠标、键盘一起用。”说到这里,洪小文兴奋地从办公室座位上一跃而起,指着墙上的白板:“假如教授正在这里讲课,他只需要一指墙上的投影说‘关上’,就可以了!”

用人类最自然、最熟悉的方式和电脑工作,一直是微软亚洲研究院的梦想。虽然微软在Xbox上取得了不错的成绩,但真正要把“多通道”做到“放之四海而皆准”,每个人都可以用起来,挑战还是很大。比如,语音识别时噪音能不能实现干扰辨认?各种不同的光线对感应会不会产生影响?还有手势如何做到像今天的键盘、鼠标这么精准?都需要时间继续研究。

搜索走向社区化、意图化

搜索依然是互联网上最大的应用。互联网是一个最大的知识库,搜索引擎在如何准确地将知识传达到需要的地方,仍有很多的阻碍,语言就是其一。去年,微软亚洲研究院研发的微软必应词典(英库)获得《华尔街日报》2010亚洲创新奖——“读者之选大奖”。“我们打破搜索的语言障碍,把全世界的知识让更多的人享用,这是下一代互联网搜索很重要的方向。”洪小文说。

未来,搜索会与社交网络发生更多的融合,比如通过Facebook找人与人的关系,而微软亚洲研究院开发的“人立方”关系搜索引擎,纯粹是机器自动抽取数据和信息。这些信息来自于广泛的互联网所形成的知识库,这无疑将会得到非常全面的关系图谱。

另外,搜索技术还会向Intent(意图搜索) 演进。没有人为了找内容而找内容,肯定是有一个目的。比如微软亚洲研究院开发的学术搜索引擎,帮助用户快速找到有关学者及其学术活动的信息。有了学术搜索,用户可以很容易地找到顶级研究人员和相应的论文,以及相关的国际会议和期刊信息,还可以根据合作论文的亲疏程度,找到研究人员之间的关系。

以数字为中心的计算

今天是一个资料爆炸时代。不管什么领域,都可以将每天收集到的资料处理为信息,信息再变成知识,知识再转变成力量。各行各业都可以根据客户、产业链的各种资料,减少成本、增加营收、扩大用户群。但是,要做到这一点的前提是,必须收集到相关的资料,并进行分析,最后做出正确的决定,以改善营运。洪小文说:“这是一个很大的革命,必须要有大型的云计算的设备收集、处理、分析资料,并要做出可以理解的图表帮助领导做决策。这整套的东西,就是我们讲的以数字为中心的计算。这套架构是希望中小企业以及各产业客户,可以用租的方式,将数据中心放在云里面,由云全天候为他们提供有用信息,帮助做决策。”

微软亚洲研究院最近研发的一项能够改善驾车路线功能的T-Drive项目,就是以数据为中心的计算应用之一。研究员通过分析 3.3万辆北京出租车的 GPS数据得出了更优的驾车路线:T-Drive相比Bing Maps或Google Maps内置的路线搜索,有60%路线更优,节省16%的时间——也就是每30分钟可以省5分钟。未来,T-Drive还会再加入如交通意外、道路整修等实时数据,做出因地因时的导航。

微软首席研究与战略官克瑞格·蒙迪是享誉世界的科学家。他认为“在医疗和教育领域,更加强大的客户端设备以及自然用户界面的方式,将使以数字为中心的计算和云计算能够大显身手,发挥更加重要的作用。一款医疗机器人,可以为贫困地区的儿童提供医疗服务。走到计算机跟前,跟它对话,它就能诊断你的身体情况。”

领域间走向交叉

微软亚洲研究院的基础研究很多是跨领域的,比如自然人机界面与多媒体交叉的产物之一便是虚拟头像。微软亚洲研究院在Kinect平台上做的Kinect Avata,就是一个虚拟替身。在用及时通信软件时,我们通常会用一个卡通形象代表自己。微软亚洲研究院研发的技术,通过摄像机把人的五官及实时表情同步到虚拟卡通头像上面,你眨眼,卡通形象也会眨眼。这样在跟人交谈时,虽然不是真实的自己,却传达真实的表情,给人一种活灵活现的感觉。

自然人机界面和移动互联网的交叉,除了触摸外,另一个方向就是陀螺仪。洪小文表示,室外导航有GPS,室内导航还是空缺,可以用陀螺仪实现。比如到地下车库找车、逛商场时找正在打折的专柜,或者在陌生场所找人,只要下载一个室内地图,陀螺仪就可以进行导航,这是一个值得探索的新课题。

人工智能是终极目标

未来,更玄妙、更前端的人机交互技术是Mind Reader(读心术)。洪小文介绍,让计算机具有人工智能,不用语言和手势就知道人们心里在想什么,预测人们的需求,并妥善执行任务。“如果做到的话,就是天人合一、随心所欲的境界。”

“虽然我们的研究很多人觉得是天方夜谭,但是研究最令人兴奋的就是不断化腐朽为神奇,把这些梦境变为现实。”洪小文表示,“我们看过《盗梦空间》,会认为科幻作者很有想象力,微软亚洲研究院跟他们不一样的地方在于,除了想象,还要想办法去实现。”

敬原创,有钛度,得赞赏

”支持原创,赞赏一下“
钛粉15606 钛粉58399 钛粉08710 钛粉79603 钛粉63198 百灵鸟
336人已赞赏 >
336换成打赏总人数336人赞赏钛媒体文章
关闭弹窗

挺钛度,加点码!

  • ¥ 5
  • ¥ 10
  • ¥ 20
  • ¥ 50
  • ¥ 100

支付方式

确认支付
关闭弹窗

支付

支付金额:¥6

关闭弹窗
sussess

赞赏金额:¥ 6

赞赏时间:2020.02.11 17:32

关闭弹窗 关闭弹窗
本文系作者 刘梅 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

刘梅
刘梅

栏目主编

评论(2

  • 姬政昆 姬政昆
    回复
    0

    期待后天!

    2011-09-04 19:51 via pc
  • 郭凯凯 郭凯凯
    回复
    0

    看上去像科幻

    2011-09-03 23:43 via pc

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈