装了4亿篇档案的AI和人辩论谁赢了?IBM最强AI辩手首次登上《自然》封面

英国邓迪大学辩论技术中心的Chris Reed撰文认为,该研究开发了一个完全自主的计算机系统,能够与人类现场辩论。这一发现暗示,未来AI技术可以帮助人类制定并理解复杂的论点。

Project Debater 与人类选手辩论(来源:IBM)

2018年,IBM研究院在美国旧金山展示首个能与人类进行复杂辩论的AI系统Project Debater,右侧是以色列国际辩论协会主席Dan Zafrir.(来源:IBM)

钛媒体3月18日消息,IBM研究院杰出工程师、Project Debater首席调研专家、人工智能专家Noam Slonim和团队发表了最新研究成果:一个名为Project Debater(意为“辩手项目”)的自主系统,已可以与人类专家选手进行体面且有意义的现场竞赛辩论。该系统能通过扫描储存了4亿篇新闻报道和维基百科页面的档案库,自行组织开场白和反驳论点。虽然该研究中人类辩手被判定最终获胜,但作者认为,评分接近人类专业辩手水平,人工智能(AI)技术或具备参与复杂人类活动的能力。

据悉,本研究成果于今晨登上了顶级学术科学期刊《Nature》(自然)杂志封面。
本周《自然》杂志封面图

本周《自然》杂志封面图

本论文通讯作者、IBM研究院杰出工程师Noam Slonim博士在接受钛媒体App采访时表示,作为有史以来首个人工智能系统,Project Debater可以与人类进行有意义的现场辩论,这一研究成果具有重大意义。同时,这也是IBM研究院掌握语言这一更广泛议程上的一个重要里程碑。

钛媒体了解到,本份研究中的IBM Project Debater是首次登上《自然》主刊封面。

事实上,AI发展到今天,应用层主要是计算机视觉(CV)以及听觉环境中。虽然可能存在像GPT-3这种文章变换语言新技术,但未有其大规模商用化应用案例。如今随着技术的发展,数据集的不断延伸,具有创造力的AI辩论场景成为了新的可能。

IBM的Project Debater项目由来已久。

1997年,IBM研发的超级计算机深蓝(Deep Blue)国际象棋比赛中击败了世界冠军加里·卡斯帕罗夫(Gary Kasparov),而象棋一直被认为是一种人类社会的高智力博弈。

Project Debater项目最早于2011年被提出,研究目标是让AI与人类进行现场辩论时应对自如。2018年,IBM Project Debater首次公开亮相,并与以色列国家辩论冠军Noa Ovadia和以色列国际辩论协会主席Dan Zafrir进行辩论。最终在“是否应该增加使用远程医疗”的其中一个议题中,Project Debater赢得了辩论,但在另一个“我们是否应该资助太空探索”话题中败给了人类。最终以各获一次胜利的结果展示给世人。

如今的这篇最新论文,更多是描述Project Debater项目中的体系结构并评估了其性能,还有使用AI赋能于辩论环境的技术过程。

具体来说,研究人员利用大量人工标记的高质量数据,通过训练深度神经网络 (DNN)和弱监督DNN来提高自然语言处理 (NLP)技术框架,从而取得和人一样的辩论能力,并通过文本转语音方式输出到外界当中。

论文中称,Project Debater辩论过程主要由以下四个模块组成:论点挖掘、论据知识库(Argument knowledge base)、论点反驳和论证构建。

  • 论点挖掘:是基于约有4亿篇报道文章的大型语料库(来自 LexisNexis2011-2018 语料库),将文章分成句子,并用其中的单词、维基百科的概念、预定义索引语句等进行分类,然后使用神经模型根据这些句子代表相关论据的概率对它们进行排序;
  • 论据知识库:旨在捕捉不同辩论之间的共性,通过论点进行手动编辑,分成专题,接着利用匹配方式将相关文本转换至语音中,在输出时包含鼓舞人心的引语、丰富多彩的类比、辩论的适当框架等;
  • 论点反驳:更多是利用新的文本转语音(TTS)算法技术,为Project Debater提供清晰流利、有说服力的语言表达能力,包括添加双关语等,基于之前的语料,针对话题论点进行反驳。
  • 论证构建:主要集成一个基于规则的聚类分析系统,将此前反驳的论点、论据串起来,对于每个集群确定一个主题,类似于维基百科、百度百科的概念,从而完成与对手的辩论、交流。

那么,AI辩手真的有能力和人进行主题辩论吗?

论文中提到,研究人员向人类组成的虚拟观众提供了辩论的文字稿,让他们在一系列话题(如资助学前教育)上对该系统与人类(包括专业辩手)和现有AI技术的辩论表现进行盲打分。尽管Project Debater在组织开场白方面的得分很高,明显优于其他系统,但最后并没能赢得辩论。

最终,Project Debater在78类辩题中获得接近人类专业辩手的平均评分。
Project Debater得分情况(来源:论文)

Project Debater得分情况(来源:论文)

作者认为,赢得辩论比赛并非IBM Project Debater项目的研发重点,仅仅预示着一个新技术的开始。未来,这种AI辩手将有潜力在全球范围内协助人类制定日常的复杂决策。

“我们的辩论绝不是输赢,我们想证明AI系统和功能如何理解、生成自然语言,我相信我们做到了这一点,并且在此过程中学到了很多东西。”Noam Slonim对钛媒体App强调,AI辩手的作用,主要还是能够帮助人们推理,模拟人类困境,建立充分的论据,提供数据驱动的辩论内容的生成和表达能力,做出更好的决定。

在《自然》杂志附评论文章中,来自英国邓迪大学(University of Dundee)辩论技术中心的Chris Reed撰文认为,该研究开发了一个完全自主的计算机系统,能够与人类现场辩论。这一发现暗示,未来AI技术可以帮助人类制定并理解复杂的论点。

针对于该技术系统的难点和局限性等问题,Noam Slonim表示,Project Debater的数据语料依然较少,情感层面还无法与人类比拟。

他认为,有些问题人类本能理解支持某一主题,但对于AI来说,直接理解十分困难,大都依靠数据语料。如果Project Debater没有学习任何主题,其只能创建有说服力的描述,并非直接产生论点、论据等。他希望未来该系统可以覆盖更庞大的语料库,从而更好解决十分困难的辩论议题。

IBM方面透露,目前Project Debater项目已经实现了部分商业化,潜在应用包括金融顾问、律师、公共事务决策、学生助手和企业决策者等。在上周举行的格莱美颁奖典礼上,该AI辩手就流行文化话题展开了非打分式辩论。

Noam Slonim强调,Project Debater解决了一个重大的挑战,代表了AI技术的进步,而且拓宽(超出)了当前AI技术的舒适区,未来将能够参与更加复杂的人类活动。

(本文首发钛媒体App,作者|林志佳,编辑|盖虹达)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

16:12

港股收评:恒生指数跌0.99%,恒生科技指数跌2.35%

16:08

国联水产:下修业绩预期,2023年预亏4.6亿元-5.6亿元

16:04

德国商业银行预计今年下半年布兰特原油价格将位于每桶90-95美元

16:03

奈飞美股盘前跌近6%,宣布将停止报告季度订阅用户数量

15:55

外交部:美方抛出所谓中国“产能过剩”论,是赤裸裸的经济胁迫和霸道霸凌

15:50

瑞银资管上海公司增资至5.2亿

15:50

百克生物:一季度净利润6056.51万元,同比增长229.5%

15:49

商务部:还将聚焦国际消费中心城市培育建设等继续出台相关政策措施

15:48

山东一季度生产总值21652亿元,同比增长6.0%

15:48

长沙调整新房住房公积金贷款额度:最高调至80万,三孩家庭90万

15:47

深圳证监局对国信证券采取出具警示函措施

15:45

商务部:一季度实际使用外资达3016.7亿元,仍然处于历史较高水平

15:44

商务部:一季度货物贸易规模10.2万亿元,单季首次突破10万亿元

15:41

上海:一季度新建商品房销售面积394.28万平方米,同比增长0.7%

15:41

上海:一季度居民人均可支配收入26460元,同比增长4.9%

15:35

限购40万元,又有热门QDII基金下调大额申购上限

15:34

上海:一季度地区生产总值11098.46亿元,同比增长5%

15:34

商务部:消费仍是拉动经济增长的主动力

15:33

商务部:一季度商务运行呈现总体平稳、结构优化态势

15:29

万安科技:公司目前暂未向问界汽车供货

扫描下载App