AI 能在围棋上碾压世界冠军,为什么却玩不好卡牌游戏?

时间:2019-04-13 12:24 来源:网络整理  作者:采集侠

AI 能在围棋上碾压世界冠军,为什么却玩不好卡牌游戏?

产品

04-01 16:25

-

评论

分享到微信

使用微信扫码将网页分享到微信

从 AlphaGo 战胜世界围棋冠军柯洁,到 Libratus 在赌场大胜多位德州扑克顶尖高手,人工智能似乎已经在棋牌类游戏领域所向披靡了。

不过这不意味着人工智能就能成为新的「赌神」,因为就算 AI 能在棋盘更快计算出各种可能性,但面对看似更加简单的纸牌类游戏,反而没那么得心应手了, 研发出 AlphaGo 的 DeepMind 就把下一个挑战的目标放在了一款卡牌游戏花火(Hanabi)上。

图自:《华尔街日报》

最近 DeepMind 和 Google Brain 团队在一篇论文中披露了这项研究的进展,与之前训练过的围棋和扑克等游戏不同, Hanabi 这款游戏要求 AI 更加深入了解其他玩家的心理,进行更高层次的推理,这也是 AlphaGo 这类 AI 目前面临的瓶颈。

AI 为什么玩不好纸牌游戏,在回答这个问题有必要先简单了解一下 Hanabi 这款卡牌游戏。

Hanabi 是一款 2-5 人的合作类型卡牌游戏,包含 5 种花色的牌组 。只有将不同花色的卡牌按照一定顺序的组合排列才能达成「花火」。

在牌局中玩家不能看自己的牌,只能看别人的牌,玩家只能有限的提示进行推理,或者和其他玩家进行战略性合作,才有机会在游戏中胜出。

从游戏规则就能看出,这款游戏对于沟通和推理能力的要求比较高,AI 需要读懂其他玩家提示字面意思外的隐藏信息,并推断出对手的意图。

▲ 图片来自:《赌圣》

研究人员很快就发现这并不容易。DeepMind 团队曾用在其他博弈游戏验证过了海量数据来进行训练,让算法利用自身副本进行 200 亿次「有效无限」的动作,按照玩家每次移动需要 30 秒计算,这相当于一个人在游戏中进行了 3 亿次操作或者玩了 1.66 亿小时游戏。

这种训练的效果在双人游戏中十分有效,然而在 Hanabi 这种有 4 人或 5 人参与的游戏中,AI 的表现却始终还是比专业玩家要差得多。

研究团队指出,算法要在不同环境的更好的交流需要高效的编码和适应性。比如不同玩家表述的风格和用语可能都不一样,但即便是最先进的 AI 也无法像人一样快速适应新的玩家,AI 只能遵循复杂但相对固定的规则,比如围棋。

目前 DeepMind 还没有很好的办法来攻破 Hanabi 这款游戏,他们 Github 上发布了一个开源平台,让人们可以测试和完善这个算法。

▲ 德州扑克专业玩家在与 AI 对决 . 图片来自:pittsburghmagazine

前两年人工智能 Libratus 在德州扑克大赛战胜人类,曾引起很大轰动。这就是因为相比起围棋响起等全信息游戏(双方牌面都相互知道),扑克的变化更多,往往也无规律可循,甚至要用到虚张声势等手段来影响对手。前百度首席科学家的吴恩达曾表示:

扑克曾经是 AI 最难攻克的游戏之一,因为关于游戏状态你只能看到部分信息。扑克并没有单一的最优下法。相反,AI 玩家必须让自己的行动随机化,这样它诈唬时才能让对方无法确定真假。

相比起扑克,Hanabi 这种卡牌游戏的难度更上一层楼,有着更多的变量和不确定性,不仅要分辨迷惑人的假象,还要与其他玩家进行沟通和协作。就像在电影《赌博默示录》中,即便是石头剪刀布,随着规则变动和参与人数的增加,也能变成一项高智商游戏。

免责声明:“迪克体育”部分文章信息来源于网络转载是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的“稿件来源”,并自负版权等法律责任。如对稿件内容有疑议,请及时与我们联系。
图说世界

激情盛宴!好球体育直

迎亚运—2023“舟创未

“产品力+服务力”双

Roca燃情助力西班牙国

网站备案号:皖ICP备10002706号 Copyright © 2012-2016 Dikesport.com All rights reserved.

联系我们 欢迎来搞合作咨询:307991540@qq.com

健康上网忠告: 注意自我保护 谨防受骗上当 合理安排时间 享受健康生活

互联网出版许可