2024CTIS-文章详情页顶部

德扑人机对战结束:人类惨败,一场都没赢

与AlphaGo一样,虽然它们都在一个垂直的领域中打败了人类代表,但是对于解决更为现实、更多广泛的问题上,并没有多少延展的能力。

钛媒体注:由创新工场李开复发起的德扑人机大战,今天(4月10号)上午正式结束。在5天比赛里,中国龙之队全部输给了人工智能“冷扑大师”,输掉792327分,堪称惨败。

在前4天比赛里,中国龙之队和冷扑大师共交战8场次,累计33000手牌。8个场次里,中国龙之队分别输掉14145分、50992分、186842分、160723分、173936分、59938分、42744分、55664分,累计输掉744984分。今天上午,中国龙之队再次输掉47343分,保持着连续惨败的势头。

比赛的结局并不出乎意料,由于之前有过AlphaGo战胜人类棋手的前车之鉴,网友对于人类选手普遍有着悲观的预测,李开复也曾经表示“对人类能赢感到悲观,赢的概率不到10%”。

事实上今年的1月份,在宾夕法尼亚州匹兹堡的Rivers赌场,卡内基梅隆大学(CMU)开发的 Libratus 人工智能系统就曾击败过人类顶级职业扑克玩家,那场比赛共持续了20天对玩了12万手,最终AI赢得了176万美元。

此次对战的双方,机器人团队是 “冷扑大师”,它是由卡内基梅隆大学Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限德州扑克人工智能系统;人类团队是“中国龙之队”,是由杜悦领军,成员包含了许朝军、张淮、童舟、朱亚希、王天建等顶级高手,而杜悦曾在2016年的世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军。

AlphaGo与李世石的人机对战,让人工智能在垂直领域中的能力彻底展现了出来。但是此次参与比赛的Libratus 与其又有着不同之处。

从技术上来讲,扑克的游戏规则更像是在处理真实世界的问题。在围棋、象棋等游戏中,机器和人类在决策前可以获得全部信息。而在德州扑克中,并不知道对手与自己的手牌,这就存在着更多的不确定性。一般来讲,德州扑克要求参与比赛的团队需要学会“使诈”。

Libratus使用的策略并非基于专业玩家的经验,没有涉及到深度学习技术,而是依靠大量的数学。基于在匹兹堡超级计算机中心大约 1500 万核心小时的计算,它使用算法分析德州扑克规则,从而建立自己的策略,而且它能够在比赛中,通过预测所有未来步骤的胜率来思考自己的下一步。

“如果AlphaGo是一个超级天才,冷扑大师CMU系统其实一定程度上是一个EQ专家,是靠EQ来打败你。”李开复这样形容它,

 AI利用增强学习技术,从自我对局中学习最优的扑克玩法,而避免从人类的既定模式中学习经验,这是非常重要的一点。”

不过,Libratus的算法现在也只适用于一对一的比赛,如果常见的多人比赛,那么算法策略上还需要进行升级与调整。

而且与AlphaGo一样,虽然它们都在一个垂直的领域中打败了人类代表,但是对于解决更为现实、更多广泛的问题上,并没有多少延展的能力。

人工智能如何发挥自己的商业价值?

这不仅仅是AlphaGo与冷扑大师所面临的问题,而是整个人工智能领域所需要解决的事情。在李开复看来,这需要满足三个条件:海量的数据、数据有标注、单领域。例如在金融领域,金融是虚拟的由人创造的,数据量庞大且天生带有标注。

李开复在比赛结束后讲,“人工智能已从完美信息的AlphaGo,延伸到了不完美信息的冷扑大师,人机对战基本没有悬念了,据闻AlphaGo近期即将来华和柯杰对战,其实已经不再具有科学意义了,以后更应该关注商业领域的人工智能,在金融、医疗、教育等领域产生的商业价值。”

从实验室,到与人类对战测试,到现实场景的应用,这样的一条路径在现在讲求“效率”的社会上,可能有一点点慢。但是未来人工智能的广泛应用,则是已经被诸多商业、媒体与技术大佬们所认可的么?

此外,在今天下午还有一场“名人赛”,是以李开复博士为首的创投、科技、娱乐圈各路大咖将组成六组战队,分别与冷扑大师一较高下。

这场比赛,也许结果更容易猜测出来。 (钛媒体编辑张霖综合报道)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 套用马云的一句话:So tm what,其实还只是初级的人工智能,如果把灵犀,siri这样助手做好才是正理。

    回复 2017.04.11 · via pc
  • 面临大失业的洗牌吧

    回复 2017.04.11 · via android
2

扫描下载App