德州扑克人机战,华人顶尖牌手组成的龙之队输了首场
本报讯 4月6日,国内首次德州扑克人机大战在海南打响,在经历了10个小时的对战之后,第一天的比赛在北京时间21点,以龙之队负65137分结束。
由创新工场李开复发起的“冷扑大师VS中国龙之队——人工智能和顶尖牌手巅峰表演赛”,由6位华人顶尖扑克选手组成的中国“龙之队”与美国卡内基梅隆大学研发的人工智能扑克机器人一决高下,比赛将于4月6日至10日举行,为期五天、长达45小时36000手牌,获胜一方将获得200万元奖金。
“冷扑大师”是基于卡内基梅隆大学开发的Libratus无限德州扑克人工智能系统,在今年1月份曾在一对一不限注的比赛中战胜了4名人类顶尖选手。
相比于围棋,德州扑克是“非完整信息游戏”,信息不完全透明,玩家只看得到自己手中的牌,无法得知对手的牌,并在博弈过程中包含了欺骗和推测的技巧。中国龙之队领队杜悦在赛前曾表示,“自己的团队或许只有10%的胜率。”
据李开复介绍,“冷扑大师并不基于大数据、深度学习、强搜索等传统AI方法;而是基于博弈论,结合大量的数学和概率,直接在比赛同时动态优化胜率最高的数学模型。”
在上午的比赛中,杜悦领衔的中国龙之队在3600副手牌的争夺中总共输了14145筹码,几乎与冷扑大师打成了平手。而下午的比赛龙之队再次输给冷扑大师50992筹码,暂时以龙之队负65137筹码结束了首日比赛。
从本次比赛的规则来看,本次比赛采用1V1单挑的模式,这是因为“冷扑大师”暂时还不能挑战人类比赛常见的多人桌赛制。另外,每局重置筹码的方式在某种意义上降低了电脑方面的难度,手中筹码量的不同,在打牌策略上也会有很大变化。而目前的冷扑大师还无法做到在不同筹码量的前提下,与人类对抗,因为初始等量筹码和不等量筹码在数学模型的建立上有本质上的区别。
之所以发起这场人机扑克对战,李开复称这和他1988年在母校卡内基梅隆大学开发了“奥赛罗”,成为第一个击败黑白棋世界冠军的人机对弈系统背景有关。而“冷扑大师”的研发和成功,或许将在以后适用于需要用到战略推理和多方谈判的场景,例如企业谈判、商务谈判等行为活动。 本报记者 张峰