在“阅读理解”这件事上,AI再次把人类甩在了身后

一个人必须去理解机器的时代,或许该落幕了。

题图来自:视觉中国

题图来自:视觉中国

提起阅读理解这四个字,你会想到什么?

被四六级雅思托福支配的恐惧?语文试卷上连原作者都搞不懂的选择题?

不管哪种答案,肯定都逃不出一个规律:进行阅读理解这项有益身心运动的主体,必然是跟你我一样的人类。

毕竟嘛,这东西需要阅读一大段文字,然后理解了意义之后再做题目,堪称一场考试中最复杂最费脑筋,也最考验综合能力的一个环节。所以你的英语老师一定说过这样一句话:得阅读理解者得天下。

然而,可是,但是,如果告诉你今天得这个天下的已经不再是人类,而是AI了,你会怎么想?也许此前我们想象过单词听写、句子翻译甚至写作都可以被AI完成,但是阅读理解这件事人类已经被甩在了AI身后,大概很多人都没想到。

可事实就是这样,1月11日,斯坦福大学著名的机器阅读理解赛事SQuAD刷新了全球排名,阿里巴巴凭借82.440的精准率打破了世界纪录,超越了人类82.304的平均得分。

当然了,AI是不会去跟你比托福刷分的,这件事的背后,脑洞有点大哦…

什么是机器阅读理解?

机器阅读理解,虽然看起来只是让AI上阵来一场考试。但是却是自然语言处理技术中,继语音判断、语义理解之后最大的挑战:让智能体理解全文语境。

而斯坦福大学发起的SQuAD挑战赛,则是业内公认的机器阅读理解最高水平赛事。

SQuAD挑战赛的基本规则,是通过众包的方式构建一个包含10万个问题左右的大规模数据集,并给出来源于维基百科长度大约在几百个单词左右的文章。参赛者提交的AI模型在阅读完数据集中的一篇短文之后,回答若干个基于文章内容的问题,答案与标准答案进行比对,最终得出成绩。

由于阅读理解这项“智能”调整,需要运用到大量逻辑、细节和结构分析能力,并且直接作用于现实中的文本资料,所以实际价值很大。

比如说,我们首先要面对的问题就是,假如人工智能已经比人类平均水平更擅长在对文本中精准信息进行理解和回答,会带给我们什么呢?

当AI的“阅读理解”得分超越人类,意味着什么

举个例子或许可以很简单的理解这个问题:英语考试上,当机器可以翻译单词的时候,我们一点都不惊奇;但机器可以听写整句话的时候,我们会感叹技术进步了;当机器自己做阅读理解的时候,我们大概会想:还要我考这个试干什么?

这里面的差别,在于处理阅读理解相关问题时,AI不只是要运算和记录,而是要主动去分析和理解,所以阅读理解问题一直被人问是NLP的标志性临界点。但这个点被AI破解,直接意味着很多必须人类才能完成的工作已经正式能够被AI接管。

因为阅读理解问题,不只是要处理语音和简单的语义,而是要理解和关注词汇、语句、篇章结构、思维逻辑、辅助语句和关键句等等元素构成的复杂组织网络。

机器阅读理解“达标”,最直接的产业影响,是大多数今天还必须由人工完成的规则、对话、服务信息类的相关理解工作,都可以被人工智能所取代。比如说客服、信息管理和推荐类的工作,都可以考虑用不妙不休、高运算速度的机器来取代。

机器阅读理解如何工作

或许我们都注意到了这样一个问题:今天的互联网世界,在变得越来越多文本内容,各种各样的信息爆炸而来。太多你知道的、你不知道的、你以为自己知道的却实际不知道的事情呼啸而过。甚至你双11想要剁个手,都有各种各样的游戏规则等着你。自己读吧,太累太痛苦还没时间,问客服吧,很可能出错还很慢,简直是薛定谔式问题。

这里或许就可以用机器阅读理解来解决了。比如客户对某个电商促销规则有疑问,就可以直接向AI提问,而AI就可以把这个问题当做一道阅读理解问题来进行解决方案回馈。

机器阅读理解能力,将在如何向客户提供非模板式的智能客服服务中发挥作用。而当AI在这些能力上超越人工,那么机器客服的利用价值将可能快速提升。换句话说,机器客服终于可以不那么机器了.....

由此不难看出,这种关键能力的标杆性突破,对大量强调与普通消费者交互的产业线益处最多。

推而广之,机器阅读能力也是文娱领域进行内容寻找和推荐的有效方式,比如阅读用户提出的复杂需求,进行精准推荐;与IoT产品相结合,给出对用户大段语言的回馈,乃至对话互动,都必须以机器理解能力为依托。

理解力,让我们在未来面前不仅是个孩子

除了知道AI可以充当更好的客服之外,究竟我们为什么应该关注机器阅读理解这件事?或许关键,是我们应该知道“理解力”在目前AI世界中的重要程度和期待指数。

AI作为一种从计算机科学下的分支,一个智能体先天具备的是运算能力,而希望进行仿人类智慧的智能模拟,第二步就是模仿人类的感知。今天我们看到的机器视觉、语音识别、语义理解,都是在做这件事。而第三步,就是让AI产生理解力。

显然,识别有着庞大的应用场景,并会在接下来很长一段时间内占据主流。但是AI的理解能力是大多数识别能力的进化,假如单纯的识别出却无法产生输出,那么AI无非是更灵活的传感器而已。

从这个逻辑上看,阅读理解这道题绝不仅仅是个测试,或者商业应用的技术加持,更重要的是开启AI纪元里理解力的加速器。

更广阔的意义在于,我们或许距离永远不用测试机器阅读理解更近了一步。当我们不再考虑机器是否能理解人类文本和语言,那么DeepNLP将可能达成,人机交互的范围将级扩大。机器智能可以开始捕捉人类的逻辑和函指。

可能那还很远,也可能很近,但机器理解力让我们在未来面前不止是个孩子,应该是毫无疑问的。

本文系作者 脑极体 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 都是有钱人的玩具 ,跟我们有啥关系

    回复 2018.01.15 · via pc
  • 一个完美的AI天生适合学习

    回复 2018.01.15 · via android

快报

更多

2026-04-04 22:23

特朗普再警告伊朗:“48小时内”可能采取进一步行动

2026-04-04 22:13

美媒:至少16架美国MQ-9型“死神”无人机被击落

2026-04-04 21:10

兆瓦级氢燃料航空涡桨发动机首飞成功

2026-04-04 21:04

配给、调价、限水……斯里兰卡多措并举应对能源危机

2026-04-04 20:48

希腊政府因冒领欧盟农业补贴丑闻再次改组

2026-04-04 20:16

4月4日新闻联播速览25条

2026-04-04 20:01

匈牙利总理:欧洲能源危机逼近,欧盟应尽快补充油气储备

2026-04-04 19:59

充电涨价与“用油发电”关系不大,中国不存在大规模用油发电情况

2026-04-04 19:26

伊朗允许运载必需品的船只通过霍尔木兹海峡

2026-04-04 19:24

多只千亿市值科技巨头近一周获得逾百家机构调研

2026-04-04 19:23

土耳其两周用掉近120吨黄金

2026-04-04 19:20

伊外长:美媒歪曲伊朗立场,伊朗从未拒绝前往伊斯兰堡

2026-04-04 18:47

Meta将在旧金山湾区裁减约200人

2026-04-04 18:43

第十六届中国航展参展工作协调会召开,已有超1100家企业确定参展

2026-04-04 18:40

伊朗否认石化经济特区遭袭后发生有毒物质泄漏

2026-04-04 18:39

中信建投:紧盯中东变局,把握中国优势资产

2026-04-04 17:54

以色列最大天然气田恢复运营

2026-04-04 17:41

4月3日,全社会跨区域人员流动量20826.9万人次

2026-04-04 17:36

受油价上涨影响,美联航上调行李托运费标准

2026-04-04 17:34

日本商船三井公司:关联公司一艘液化石油气船通过霍尔木兹海峡

2

扫描下载App