科大讯飞胡郁:未来10年,人工智能会走入每个人的生活

在将来的10年,人工智能也会像水和电一样进入到我们的生活当中,让每个人都离不开。

随着AlphaGo挑战人类成功,人工智能(AI)吸引了越来越多人的关注。人工智能离我们有多远?在9月13日举办的“2016新浪C+峰会”上,科大讯飞创始人、轮值总裁、研究院院长胡郁发表了题为《从能听会说到能理解会思考,以语音为入口的认知革命》的演讲。胡郁认为,在将来的10年,人工智能也会像水和电一样进入到我们的生活当中,让每个人都离不开。

胡郁演讲过程中,现场使用了科大讯飞最新的语音转写产品“讯飞听见”,把他的演讲内容变成文字展示在屏幕上。钛媒体编辑注意到,胡郁在有意加快语速,1分钟300字左右,屏幕上的字几乎同步出现,只有个别词有错误。如果让机器不断学习,随着技术的进步,也许速记这个职业真的会被替代!这对于经常要整理录音的记者们来说是个不错的消息。

胡郁先回顾了人工智能的发展历史。从概念提出至今已有60年,人工智能的发展并不是一帆风顺的。人们从对它期望过高,到失望,到再次关注,到这两年非常热。目前国内外很多国家投入人力、物力进行研究,因为大家越来越意识到,人工智能不仅关系到我们每个人的生活,还关系到国家发展。

人工智能发展、实现突破的关键点是什么呢?胡郁从人类的起源讲起,认为在七万年前,智人灭了其他的猿人成为现存人类的祖先,是因为认知革命使其在语言和智能上实现突破。而人工智能应该分为计算智能、感知智能和认知智能,其中认知智能是机器智能战胜人类的非常重要的节点,它们现在还有很大的差距。

而实现人工智能突破的思路也分为两种:一种是通过对人类大脑的了解,从脑神经学习的机理、机制、结构等出发,设计更好的算法;另一种是目前业界已经使用的人工智能的算法,更准确的叫法是大数据人工智能。利用深度神经网络、大数据还有涟漪效应,共同养成我们现在的视觉、听觉和自然语言处理方面的能力。

最后,胡郁还介绍了“讯飞超脑”的最新进展。包括最新发布的产品AIUI,可以把对话的成功率从40%提升到90%以上;语音合成技术,可以让奥巴马为科大讯飞“代言”;口语评测系统,可以听懂口语并给予评价;此外,科大讯飞正在参与研发一款能参加高考的机器人。

以下是胡郁演讲内容,经钛媒体编辑:

在过去的两年当中,人工智能突然变得非常热,很多人变得很兴奋。但是也衍生了很多问题,就像主持人说的,人工智能在3月份战胜了世界围棋大师李世石九段,很多人就以此推断说人工智能要颠覆人类,甚至要灭绝人类的时间不远了,但是是不是真的这样呢?

人工智能的发展史

讲到人工智能这个话题,要回溯到1946年世界上第一台电子计算机埃尼阿克的诞生,埃尼阿克产生以后,许多的计算机科学家对于计算机将来能够代替人类做什么事情有很多联想,其中最著名的一个人是图灵。图灵在二战的时候发明了非常重要的炸弹,这个炸弹可以破解当时德国的密码体系。在二战以后,埃尼阿克发明以后,图灵在1950年左右在人工智能领域进行了很多的探讨,并且提出了著名的图灵测试。

但是真正的“人工智能”这个词被提出来,是在1956年Dartmouth的会议上。今年是“人工智能”这个词被提出来60周年。当年在Dartmouth提出来“人工智能”的人,包括明斯基、西蒙、麦卡塞等等,这些年轻的学者提出“人工智能”这个概念以后,他们中间诞生了四位图灵奖得主。时光荏苒,最后的一名参与者也已经去世了,但是我们已经可以看到人工智能的发展。

但是人工智能的发展也不是一帆风顺的。当一项新技术出现在人类社会的时候,大家会抱以非常高的期望。在人工智能刚刚提出的时候,所有人都认为用规则推理的方法可以解决这个问题。因为当时的计算机、存储和各个方面的原因,当时是大型机的时代。IBM的总裁曾经说过,世界只需要五台计算机,事实证明他错了。但是人工智能经过了五六十年代的发展,离大家的期望很远,所以人工智能进入了沉寂期。随着80年代个人电脑的发展,人工智能再次引起了大家的关注。以日本的第五代计算机为重要的表现,中国的863计划也设计了智能计算机主题。

中国现在领先世界的超算,包括科大讯飞本身都得益于国家863计划在智能计算机这个主题下很多的投入和创新。但是其中一个非常有名的例子大家都知道,在90年代人工智能又再次陷入了低谷,因为很多人发现,互联其实可以帮助我们解决很多的问题,我们的信息化技术能够解决我们生活中大部分的问题,我们并不需要人工智能,而且人工智能也做不到。进入二十一世纪,特别是随着移动互联网和互联网的发展,我们再次发现,人工智能其实是有可能做得到的,等一下我会给大家阐述一下为什么能做得到。

人工智能与人类的关系

有一个非常重要的话题,人工智能会不会威胁人类?会不会抢去我们的饭碗?Gartner的一个报告,说到人工智能越来越多的参与到我们的生活当中去。德勤的报告分析了现在人类的工作,有多少已经被现在已经可以用的人工智能的技术所代替。其中有一个好消息,CEO大概只有20%的工作可以被代替。我们的园丁、清洁工被代替的比例更低,只有10%。但是也有一个不好的消息,今天在座的各位可以看到,机器人可以直接帮大家把语音转写成文字了,这个对于记者来说是好事。但是同时它也会开始写稿了,最近在美国,包括腾讯的一些人工智能的技术都已经在展现,说机器人如果写报道类的,陈述性的稿件也许比人还要精确。

我们其实也可以看到,人工智能的发展并不是一个线性的。大家都知道,我们今天的宇宙其实是在100多亿年前有一个经典大爆炸,但是人工智能的发展经过60年来的跌宕起伏是不是也面临着同样的境地呢?很多人相信,包括雷·科兹威尔,他说2045年人工智能将会有爆炸式的发展,很多人骂他是骗子。事实证明,在数字的世界里面,确实人工智能是有可能在一个基点上发生变化的。但是我们也知道很多现实的东西,比如说我们的能源、材料和物理世界变化没有这么大。所以我觉得这中间可能是一个非常颠覆的问题,我们在将来的二十年当中会取得令人惊讶的变化,但是人工智能是不是会颠覆人类?我觉得今天的C+峰会其中有一个话题非常有意思,就是意识方面,我等一下会讲到。

在过去的几年当中,大家已经接受互联网和移动互联网作为基础设施,就像我水和电一样进入到我们的生活。在将来的10年,人工智能也会像技术和服务进入到我们的生活当中,每个人都离不开。人工智能之所以受到这么广大的关注,不仅仅是因为这个技术炫,而是影响到我们的生活,不仅关系到我们每个人,还关系到我们国家。据我所知,美国的国防部长卡特最近去了一趟硅谷,因为美国想在将来继续维持霸主地位,非常重要的就是希望在军事上率先做出无人战车的部队和无人舰艇的部队。大家都知道,人工智能的人才非常昂贵,所以卡特要专门跑到硅谷去找人,那是国家的必争之地。

认知智能是人工智能战胜人类的关键节点

要回答这个问题,其实我们要先看一下人类。意大利一名很年轻的历史学家雅克·阿塔利写了一本书,叫做《人类简史》。他提出了一些非常重要的现代近代考古学上的发展,因为基因技术的发展,我们知道地球上所有的人类,包括白色人种、黄色人种、黑色人种、棕色人种,我们的祖先都来自于非洲的智人。在智人以前,地球上的猿人已经存在了三四百万年,在旧石器时代和新石器时代,在中国有我们讲的元谋人、山顶洞人、蓝田人等等,但是他们不是我们的祖先。为什么在七万年前,智人灭了其他的猿人,获得了真正的地球的统治者的地位?

其实那本书写得非常清楚,就是在七万到两万年之前,人类有农业革命、工业革命,还有一个重要的革命是认知革命。而认知革命是人类用语言和智能战胜其他猿人的非常重要的方面,因为有几个方面的事情:一是可以把客观事件描述得准确;二是八卦,我曾经以为八卦是女性社会非常不好的习惯,但是没想到是非常重要的,由原来的100人的团队可以变成150人到1000人的团队。因为有了语言,我们可以交流我们在做梦中,或者我们思维里面的东西,我们可以产生虚构的概念,我们可以产生宗教、公司等等,从而让我们人类成为地球的主宰。

这位老兄雅克·阿塔利最近又写了一本书叫《未来简史》。我曾经说过,因为我们现在的人工智能跟我们的意识其实根本没有任何的关系,所以我并不认为机器的发展将来能够残害人类或者替代人类,但是雅克·阿塔利说即使机器不会产生自我意识,当它的智能达到一定程度以后,所有的人类都会懒惰到躺在那里等死而已。当然我非常不认同这一点,我要看看《未来简史》写出来以后到底怎么样。

在过去几年,许多媒体接受了这样一个观点,关于人工智能的分类。这是我提出来的,我当时把它叫做计算智能、感知智能和认知智能。机器发明出来以后,我们都知道计算能力和存储能力远远的超过了人类。在运算智能方面,机器确实远远超过人类,1997年“人机大战”中战胜国际象棋世界冠军卡斯帕罗夫的超级并行计算机“深蓝”。比如说阿尔法狗看过3000万盘棋,其中2900多万盘是自己跟自己下的,在感知这个世界。我们可以看到,我们可以听到,我们可以感知到。机器就像动物一样,这方面机器在快速的赶上我们,因为机器的传感器,人工智能算法越来越清晰。在认知方面动物和人类差得很远,在政治方面发展很受限制,因为没有语言,就没有知识,没有知识就不能做复杂的推理。所以认知智能是机器智能战胜人类的非常重要的节点,它们现在还有很大的差距。

发展人工智能的两个思路

实现人工智能突破的思路其实也分为两种,一种是我们正在参与的国家的脑科学人工智能重大规划,我们希望通过对人类大脑的了解,能够帮助我们设计更好的算法。但是大家知道,对于大脑的了解是一个非常漫长的过程,我们还在努力,我们跟中科院的神经所,跟很多部门都在进行这方面的联系。但是另外一方面,我们业界里面现在已经使用的人工智能的算法,其实应该把它叫做大数据人工智能,它通过我们很多的技术已经能够了解到。

到底脑科学里面能学习什么?曾经吴军有一本书叫《智能时代》,里面有一种提法叫“鸟飞派”,当我们要学习飞翔的时候,我们最先想到的是像鸟去飞,我们把身上贴满羽毛找一个高一点的地方来跳,相信大家都知道。但是后来人类发现了空气动力学,我们造出了比鸟更好的设备。当我们研究大脑的时候,我们不一定要把大脑完全的复制和克隆出来,我们可以找到这里面的智能。我相信我们可以找到关于脑神经学习的机理、机制、结构这些方面可以帮助我们。

但是另外一方面,在当前的工业界,真正的已经能够看到的是什么呢?是我们利用深度神经网络、大数据,还有我们的涟漪效应,来共同的养成我们现在的视觉、听觉和自然语言处理方面的能力。这方面我要介绍一下涟漪效应,涟漪效应和网络效应有点类似,是利用我们互联网思维来解决人工智能的思路。因为大家都知道,任何一项人工智能出来的时候不那么先进,但是需要真实的人员用它,贡献真实的数据和经验,就做一个产品放到这里面去。当一个水滴滴到水面的时候它的扩散是需要时间的,这个时间慢慢的扩散越多,使用的人越多,这个水滴有错误的误差,一开始的错误是很大的,当越来越多的人用的时候,技术就改进了,传播得越广错误就越小。当没有传播到整个人群的时候,已经训练得很好了,这个水波纹已经慢慢消失了。但是对于刚接触到它的人,会觉得这个东西怎么这么好,这就是我们现在做人工智能的思路。

“讯飞超脑”的最新进展

科大讯飞正在做的一件事情就是“讯飞超脑”,我们要做语音和语言为入口的机器认知革命。这里面包括感知智能和认知职能。通过模仿我们人类的感知智能,上升到人的认知的层面,我们有个Think Machine,可以对你的概念进行推理和解决。解决完了之后有一个执行,这一项技术我们其实最近已经取得了很好的成果。

大家都知道我们的声音其实在我们的脑海里面,在声音处理里面能够看到有一个语音谱图。非常牛的人员,利用这个语音谱图来判断。我们现在做的成果可以利用图像处理的方法处理我们的语音,跟我们耳朵里面的听觉系统是非常接近。不仅仅如此,更加重要的是解决认知的问题,里面包括语音翻译、知识表示、联想推理和自主学习。我们也有非常多的核心的模块,包括自主的语意表示,进行逻辑推理。

我们借用了人脑里面非常重要的注意力模型。女性开车的时候,视野很窄,所以说大部分的女性同胞可能出事故的情况比较多。我们最新发布的一个产品是AIUI,我们非常希望能够跟所有的智能硬件进行非常自然的交互。但是大家都知道,用过语音交互的人,虽然讯飞语音云现在已经为18万的开发者每天提供超过25亿次的语音服务,而且我们还连接到8到9亿台设备,但是他们的感觉坦白来说并不好。利用的AIUI,我们将原来单次的交互变成全智能的交互,我们将语音识别、语音合成、自然语言理解和整个对话过程融为了一个整体。现在国内百分之八九十的产品都会连接到我们新的AIUI的产品上,给我们带来不同的体验。采用这项技术之后,我们对话的成功率从40%提升到了90%以上

另外讯飞超脑在感知认知方面的两项成就,我给大家简单介绍一下:

一个是口语评测,大家都知道,全世界都没有口语考试,为什么?因为口语考试没有办法改卷子。广东省曾经在高考中考过一次口语,77万考生录下音来以后,找了2千个英语的老师和师生来听,改了两个星期都没有改完,而且压力非常大。但是我们现在用机器的方法,可以自动的听懂你的口语里面说什么,还给你评价,你怎么样读错了,你的语音、语义这方面都可以评价出来,现在世界上只有中国在广西、广东、江苏可以中考里面考英语口语。

不仅仅可以考口语,我们还可以考手写作文,我们可以对你的作文进行评价和批改。我现在还在带领863的一个专家团队,应该说是国内最大的一个团队。31家单位参加,近几百个老师,上百个教授在参与的中国的高考机器人,就是我们要做一个机器人参考高考,之后还能考上清华北大,看到题目之后它就可以给出答案,其实考试是评价人工智能一个非常重要的方法。

更多深度观点,关注钛媒体微信号:钛媒体(ID:taimeiti)

钛媒体微信二维码

 

本文系作者 佳音 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 好好商业化,我等着呢

    置顶
    作者赞过
    回复 2016.09.16 · via android
  • 人工智能这个话题是绕不过去的

    回复 2016.09.25 · via android
  • 在一起吃晚餐時的

    回复 2016.09.16 · via iphone
3

扫描下载App