别轻易相信AI颠覆人类,做高考题它们还是输给了中国考生

摘要: 出人意料的是,这一次AI并没有全面碾压人类。阅卷结果显示,三组高考状元分别得分为146分、140分、119分,而Aidam为134分。

当 Alpha Go 又一次出招,三连胜中国围棋天才柯洁之后,或许人们担心的可能是,人工智能下一步又要在哪个领域干掉人类。

不过,在考试这件事儿上,经过了大量“学习”的机器人,也还是没能超越人类。不得不说,中国学霸实在威武。

昨天是2017年全国高考第一天,在当天的数学考试结束之后,一场人机高考大战的对决在北京上演了:在线教育公司“学霸君”自主研发的智能教育机器人“Aidam”首次公开亮相,通过现场直播的方式,与六名高考状元同台竞技今年全国卷文科数学试题,完成包括客观题和主观题在内的整张试卷,并按照评分标准得出最终成绩。

不过,出人意料的是,这一次AI并没有全面碾压人类。阅卷结果显示,三组高考状元分别得分为146分,140分,119分,而Aidam为134分,总分为150分。

在成都,“国家队”的成绩表现也不是很理想。由国家863计划 “超脑计划”牵头研制的“高考机器人”,成都准星云学科技有限公司研发设计的数学高考机器人AI-MATHS,在断网断题库的环境下,用时22分钟完成当天北京卷文科数学高考试题。

经过现场批阅,成绩为105分(总分150分)。之后,AI-MATHS再次挑战解答全国二卷数学卷,用时10分钟,考了100分(总分150分)。

AI-MATHS是由国家863计划 “超脑计划”牵头研制的“高考机器人”, 该“类人智能”项目于2015年7月21日由国家科技部正式启动。

在学霸君人机大战考试结束后的对话环节中,小组得分为119的2015年新疆理科状元多力岗表示,对Aidam的成绩有点意外,称“这个比赛结果和我们的预期还是有一定的差距,我们在比赛之后分析了一下,自己在一些细节或者在一些计算方面出了一些问题”。

当然,从接近的分数来看,这次Aidam虽然没有完胜,然而其在10分钟解题,获得了134分的成绩,也足够超越一大批考生。

学霸君首席科学家陈锐锋在考试比赛的现场解释说,Aidam解题主要分为三大步骤:

第一,把试卷题目变成机器可以理解的形式语言。

第二,在用形式语言完整描述了一系列环境之后,计算机就会在知识网络里启动搜索,确认题目触发了哪些知识点,然后进行一系列的推理,找出最佳解题路径。

第三,把解题的过程和答案,从形式语言转化为自然语言,完成解题过程。

而要实现这些,基础是庞大的数据库和人工智能领域多年技术的积累。从学霸君官方披露的数据来看,截至2017年5月,“学霸君”App已经积累超过7000万学生用户,累计已经解决问题100亿道,答疑命中率为93%。

那么,为何PK高考状元选择的是数学学科?

学霸君创始人兼CEO张凯磊说,“一千个人有一千个哈姆雷特,但是世界上只有一个勾股定理”。

数学、物理等理科类科目是强逻辑链路的,考点基本稳定,容易判定对错。同时,数学试卷中包括简单的选择题,也有复杂的需要解题过程的大题,非常适合测试AI。

学霸君创始人兼 CEO 张凯磊,他本人以高考数学和物理满分成绩考入南开大学数学基地班

对于机器人来说,形式化语言是自动解题的一大挑战,而目前数学学科最大的难点在于应用题的解题上,期间涉及到一些社会常识和文字性表述等。

在业内人士看来,让机器人参加高考,并不是项目的根本目标,只是其对于人类智能的一种模拟、扩展和延伸。目前来说,高考是一种衡量人的知识水平、理解能力、推理能力等相关智力水平的测试工具,其包含了对题目的理解、知识表现、逻辑推理等方式获得知识。

在接受钛媒体等多家媒体采访时,张凯磊表示,“实现个性化学习,大幅度提升学习效率和成果是学霸君研发智能教育机器人的初衷”。

张凯磊告诉钛媒体,中学期间大概有3529个考点、平均每个做3-4道题就够了,写1万道题目可以做完,但目前绝大部分学生面对的练习题有3万—4万,其中3/4的题目是不需要写的,75%的宝贵时间都被浪费掉了。

学霸君构建于深度神经网络的句法和语义分析器,在海量题库中不断强化和扩充训练。在K12中,有大部分的数学应用题,需要知识图谱和常识才能解决,学霸君构建的是一个真实题目海洋的模拟器,逐步提升其对于真实世界的接近程度。

基于人工智能的专家系统成就了精准推理。学霸君推进图像识别、自然语言理解、深度学习等人工智能领域的研究,并整合成为智能教育机器人。其在现有教育环境下,使机器判卷、个性化指导、个性化作业、教案改进等变成可能。

尽管如此,陈锐锋认为,即便是刷题,AI也并不能代替老师。因为,任何时候机器人都没有办法代替老师讲解。比如说,这道题为什么对,为什么错,解题思路为什么这么想不对,为什么那样想又是对的。但是,AI可以告诉老师说,这个学生的哪些知识点有问题,应该花更多时间在哪些知识点训练,而不是浪费在其他已经掌握的知识上。

值得注意的是,无论是作业帮、猿辅导还是阿凡题,目前市面上大部分工具属性偏强的题库类在线教育产品,一直都没找到盈利爆发点。张凯磊也向钛媒体透露,目前学霸君暂未实现盈利,但是已经开始实现了规模化收入。

据钛媒体记者了解,“国家队” 还将在2019年和2020年参加高考。 作为“十二五”863计划信息技术领域“基于大数据的类人智能关键技术与系统”项目的牵头单位,科大讯飞方面表示,语文、地理、历史高考机器人将于2019、2020年参加高考进行最后的成果测试。(本文首发钛媒体,记者/李程程)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

本文系钛媒体原创,未经授权不得使用,如需获取转载授权,请点击这里
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

李程程
李程程

钛媒体记者,chengchengli@tmtpost.com

评论(58

  • 狠猫 狠猫 2017-06-09 11:46 via weibo

    这个测得不是解题能力,而是阅读题目,然后理解问题是什么,然后搜索答案。所以靠的还是语文逻辑。。。你要是给他出一个绕口令式的数学应用题,它要么读题失败,要么就是飞快给到一个驴唇不对马嘴的答案,完成答题

    0
    0
    回复
  • 自然醒 自然醒 2017-06-08 14:23 via pc

    虽然高考没有颠覆人类,但能考这么高分也足以说明很多问题了。人工智能也会在未来越来越影响我们的生活。以后说不定什么题型不会,直接问手机上的灵犀,siri这样的语音助手,就直接给出答案了。

    0
    0
    回复
  • 买买提X 买买提X 2017-06-08 08:20 via weibo

    题目太傻。。本来现阶段就应该输给人类。。

    0
    0
    回复
  • 陈佳武 陈佳武 回复周子量 2017-08-18 18:35 via android

    高考题考试时你百度找得到么?就算找出一些类似的,你能把知识点,细节都考虑到么?

    0
    0
    查看对话
    回复
  • 秃头口就喝 秃头口就喝 2017-06-12 10:13 via iphone

    学霸加油,科教兴国。

    0
    0
    回复
  • 陪我银行 陪我银行 2017-06-10 08:28 via weibo

    让阿里云试试,秒杀考生

    0
    0
    回复
  • 海宝蜀黍 海宝蜀黍 2017-06-09 16:54 via weibo

    在load 速黄冈题库之前,不要提人工智能四个字[doge]

    1
    0
    回复
  • 如来是我哥_an5 如来是我哥_an5 2017-06-09 16:09 via weibo

    谷歌公司不想在这种低能领域下手而已。

    0
    0
    回复
  • 一心想做学霸的孔小天 一心想做学霸的孔小天 2017-06-09 12:59 via weibo

    看到评论区我就放心了

    0
    0
    回复
  • 周子量 周子量 2017-06-09 12:03 via weibo

    只能说学霸君垃圾了,你让一个学渣考试时允许百度他就足够称霸了,还好意思研发AI。

    0
    2
    回复
  • 麻匪托我给您带个话 麻匪托我给您带个话 2017-06-09 11:57 via weibo

    现阶段ai强的是运算,其他方面,比如语境的理解差了人类十条街,不是这家公司差,就算是做的最顶尖的,也只能算是差强人意,比如siri,比如小冰

    0
    0
    回复
  • 无知坤 无知坤 2017-06-09 11:17 via weibo

    明明是公司太水

    0
    1
    回复
  • 北京信仰 北京信仰 2017-06-09 11:08 via weibo

    发这样的新闻让人笑话,只能证明自己公司研发能力差!!!还AI公司,还是回家种地去吧哈哈

    0
    1
    回复

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈