花时间培养一个会辩论的AI是一种什么体验?

花这么长时间培养一个会辩论的AI,有什么用?

图片来源@视觉中国

图片来源@视觉中国

钛媒体注:本文来源于微信公众号量子位(ID:QbitAI),作者:郭一璞、夏乙,钛媒体经授权转载。

蓝色的舞台上,正中间立着一块黑色的面板,面板上蓝色的扁圆形屏幕正在闪动,后面传出冷静而理性的女声。

而右侧的讲台上,一位西装革履的小哥正在聆听这个面板的“演讲”,时而动笔记录,时而面色凝重,时而嘴角露出邪魅一笑,看起来信心满满,胸有成竹。
这是IBM的AI与人类冠军辩手的对决,也是今年Think 2019大会的一个环节。

人机大战的一方是IBM的的AI,Project Debater,那块黑色面板就是它在人间的载体。去年6月,它击败了2016以色列全国辩论冠军Noa Ovadia,创下了AI在辩论方面击败人类的历史记录。

左为Project Debater,右为哈利什

另一方则是2012年欧洲辩论冠军哈利什·纳塔拉(Harish Natarajan),一位牛津本、剑桥硕的学霸,本科主修政治、哲学、经济(PPE)专业,因此他也是英国前首相卡梅伦的学弟;硕士则在研究哲学和国际关系;现在则是AKE咨询公司的经济风险主管。

谁胜谁败?由现场观众的选票决定。

这场辩论的规则比较简单,拿到辩题后,双方各有15分钟的时间进行准备,提出自己的论点和可以反驳对方的论据;

正式开始后,双方各有4分钟的时间进行开场立论,之后各有4分钟时间进行驳论,最后各有2分钟时间进行总结;

而场下的观众评审则是由湾区学校里的顶尖辩手和100多名记者组成,在辩论开始前和开始之后,观众评审们各进行一次投票,选出自己支持的观点,辩论后观点支持人数增加的一方获胜,另一方失败。

直击人机辩论

主持人送出一句“May the best debater win”的祝福,人类辩手出场,Project Debater“站”在台上静静等待。

他们今天的辩题,也算关乎人类的未来,起码关乎下一代:

We should subsidize preschool。

我们应该资助幼儿园。

正方:AI辩手,反方:人类代表哈利什。

AI认为,资助幼儿园这不仅仅是个经济问题,也是道德和政治问题。她的观点可以归结为三个方面:资助幼儿园能帮儿童摆脱贫穷、有助于后续的学业,甚至还能节约医疗开支、降低犯罪率。

从立论陈述到总结陈词,AI都旁征博引:

为了说明高质量幼儿园能让孩子在之后的学业上表现更好,她引用了杜克大学的一项研究;

为了说明幼儿园和犯罪率之间的关系,她拿来新泽西州的案例,还用了好几次“大量研究表明”,列举了不少数据;最后的总结,还用上了人类作文要诀——名人名言。

人类代表哈利什也说,AI提供了丰富的信息,列举了很多事实和数据。

而他的辩论风格和AI截然不同,人类辩手当然不能和一台电脑比拼查资料举例论证的能力。

哈利什选择抓住弱点反驳,再谈现实状况。他抓住的弱点,是AI反复论证的“拯救贫穷”,谈的显示状况,是政府的钱是有限的,投资了幼儿园就要耽误其他方面。

他说,投资幼儿园帮不了最贫穷的人,而是那些本来无论如何也要送孩子去幼儿园的中产。而“良好的幼儿园”带来的那些好处,一来只是推论,二来也不是穷人能享受得到的。

所以,还不如花在更实在的地方。

这场辩论充满反差感。AI动之以情,讲人文关怀和人类尊严;人类晓之以理,谈政府要认清现实精打细算。

在驳论环节的最后,AI甚至还学会了“升华”。她(对,官方给定义了性别)说:资助幼儿园事关basic human decency,人类基本尊严。

在围观了整个过程的量子位看来,“人类基本尊严”由黑色面板背后的冷静女声说出来,现场观众大概不会有什么共鸣。AI虽然打着感情牌,整体辩论风格却是充满英美老牌报刊的气息,如同托福高分作文一般,讲论点列论据。

而人类代表抑扬顿挫,有一丝丝网络论坛上流传的阴谋论味道:别听她的,能得到好处的,还是那群中产!

我们节选了开场环节的视频,来一起领略一下AI与人类的辩论:

最终,旁征博引谈人类尊严的AI还是输给了抓住漏洞狠狠攻击的人类。

辩论开始前,现场79%的观众支持投资幼儿园,而20分钟辩论过后的第二轮投票,支持者只剩下62%。

best debater,属于人类代表哈利什。

主持人在公布结果、恭喜人类辩手时,甚至一度口误,把“congratulations to him”说成了“to them”。

“带路党”哈利什

虽然取得了本场人机大战的胜利,哈利什却是个AI带路党。他认为在不久的将来,AI的辩论水平总会比人强。

在赛后采访中,他说,AI根据论点来引用论据、统计数据的能力让他印象深刻,Project Debater如果和人类的能力结合起来,潜力巨大。

哈利什认为,相比象棋、围棋、星际2这些项目,机器想在辩论上赢过人类要难得多。在辩论赛中取胜,需要三个条件:

  1. 辩手需要巨大的信息量支持,并将这些信息组成支持己方观点的论点;
  2. 辩手必须将复杂的论点用清晰、有条理的方式讲出来;
  3. 辩手需要让观众认同这些论点至关重要。

也就是说,整个辩论的过程中,辩手需要谨慎的发言,表达情感,使用修辞,恰当举例。机器很容易在第一点中胜过人类,它可以方便的获取大量信息,并组成论点;但第二点和第三点对机器来说非常具有挑战性。

虽然难度很大,不过哈利什还是觉得未来会有AI在这三个方面都能超越人类。

AI是怎么辩论的

辩论,需要收集信息、形成结构化论点、再用精确的语言表达出来,要清晰,要有说服力。

面对现场辩论中的陌生辩题,Project Debater需要几分钟的时间来做准备。

整个过程,从搜寻资料开始。她会为了立论陈述从语料库中搜寻有用的短文本,找出几百条相关的片段。

下一步,就是根据这些片段,构建出强力、丰富的论据,来支撑要谈的观点。移除冗余信息,选择最强的语句和证据,根据主题把它们组织起来,构成叙述的基础。

几分钟时间准备好4分钟立论陈述之后,Project Debater还要听取对手发言,准备驳论。

这个过程无论是对人类来说,还是对机器来说都很难。作为一个AI,Project Debater需要识别对手的论点和论据,寻找论点论据来回应它们。

和人类冠军面对面的Project Debater,从2014年就开始为此准备了。

它自带一个庞大的知识库,从报纸杂志摘录了100亿个句子,还具备理解和生成语言的能力,还用知识图谱来寻找辩题背后隐含的悖论。

从项目开始到现在,Project Debater团队发表了30多篇论文,还开放了一个数据集。

花这么长时间培养一个会辩论的AI,有什么用?IBM说,它可以帮网上各种论坛、评论区的辩论变得更文明更有营养,还能帮律师准备庭审资料,甚至能在金融领域辅助投资决策。

负责说话的那个女声,更是可以用到各种各样的领域。

离开爸爸保护的AI辩手

去年六月的那场辩论赛,人类高手输给了Project Debater。

不过,当时的观众评审是一群自带利益相关体质的IBM研究员,也就是Project Debater的爸爸。

比赛进行了两场,第一场是Project Debater对战2016年以色列全国辩论冠军Noa Ovadia,讨论“我们是否应当资助太空探索”,Project Debater为正方,Noa Ovadia为反方。

第二场则是Project Debater对战另一位以色列辩论专家Dan Zafrir,讨论“我们是否应当更多的使用远程医疗”,依然是Project Debater正方,人类反方。

当时的两场辩论赛中,Project Debater的语言表达相对生硬,但传递出的信息量更大,Project Debater说服的观众更多一些——当然,负责投票的观众们是Project Debater的“爸爸”,毕竟是自家儿子,投票的时候也可能偏心了。

关于Project Debater的论文合辑
https://www.research.ibm.com/artificial-intelligence/project-debater/research.html

本文系作者 量子位 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

09:12

吉利汽车将于北京车展发布首搭全新AI交互科技车型

09:11

美银调查:基金经理对中国股票的配置连续第二个月小幅上升

09:11

工信部组织开展第六批专精特新“小巨人”企业培育工作

09:10

巴菲特旗下的伯克希尔哈撒韦公司通过发债筹集2633亿日元

09:03

富时中国A50指数期货在上一交易日夜盘收跌0.27%的基础上低开,现跌0.36%

09:03

国内商品期货早盘开盘,纯碱涨超7%

08:57

币安据悉准备支付约200万美元罚款,计划重返印度

08:56

4月18日A股盘前要闻

08:53

两市融资余额增加47.44亿元

08:52

央行:坚决对顺周期行为进行纠偏,防范汇率超调风险

08:49

国家发展改革委环资司负责人会见欧盟及欧洲4国气候特使

08:48

乐刻进驻城市数量已达28座,今年总体门店预计增加400-500家|钛媒体独家

08:44

央行:将注重盘活被低效占用的金融资源,密切关注企业贷款转存和转借等情况

08:44

重要股东年内减持金额262亿元,创近11年来同期新低

08:43

央行:将继续保持货币政策的稳健性,引导金融机构保持信贷均衡投放

08:36

中信证券:银行一季度业绩为全年中的相对低点,关注市场对红利品种的配置需求

08:25

花旗:美联储没有看起来那么“鹰”,今年仍然有可能降息五次

08:20

国泰君安:军工板块重建预期需要时间,关注先进主战装备和龙头白马个股

08:19

中信证券:AI时代的存力腾飞,HBM与传统存储共振

08:19

鸿海刘扬伟:与英伟达在AI工厂、电动车的合作进展上半年就能看到

扫描下载App