继围棋之后 人工智能战胜德州扑克选手

2017-01-12 08:06 北京晨报

打印 放大 缩小

核心提示: 2017年新年开局,人工智能在与人类智慧对局上连下数城,先是升级版的“阿尔法围棋”接连击败中韩等国顶尖高手,近日又横空杀出名为“DeepStack”的人工智能新算法,在一对一无限注德州扑克中完美“碾压”人类智商。

2017年新年开局,人工智能在与人类智慧对局上连下数城,先是升级版的“阿尔法围棋”接连击败中韩等国顶尖高手,近日又横空杀出名为“DeepStack”的人工智能新算法,在一对一无限注德州扑克中完美“碾压”人类智商。

来自加拿大阿尔伯塔大学和捷克两所高校的研究人员近日在阿奇夫论文预印本网站(arXiv)上提交论文,介绍其研发的新算法“DeepStack ”首次在一对一无限注德州扑克中击败人类职业扑克玩家。

研究人员称,这种人工智能算法是一种可用于扑克等不完整信息博弈的通用算法。在与33位来自国际扑克联合会的职业扑克选手进行的4.4万手扑克比赛中,这种算法平均赢率超过450mbb/g。(mbb/g是衡量扑克玩家表现的指数,一般50mbb/g就被认为是较大的优势。)

德州扑克是人工智能的热门挑战领域。此前,被人工智能攻克的围棋是一种完全信息公开的博弈,玩家可以看到棋盘上的棋子,并预测落子可能性;而德州扑克玩家手中的底牌是其它玩家看不到的,是不完整信息博弈,对人工智能更具挑战。

一对一无限注德州扑克拥有超过10的160次方个决策点。研究人员称,“DeepStack”在处理扑克中的信息不对称性时用到了循环推理,并使用分解法将计算集中在相关决策上;它还运用深度学习技术从自我对战中自动学习了一种关于任意牌的“直觉”。

这一研究成果无疑抢了卡耐基梅隆大学研究人员的风头。他们也设计了一场类似于“阿尔法围棋”挑战李世石的“人机对战”,于当地时间11日在匹兹堡的赌场盛大启幕。卡耐基梅隆大学的人工智能系统“Libratus”将在20天的时间内与四位顶尖德州扑克选手玩12万手一对一不限注的德州扑克,奖金高达20万美元。

不过,参与设计“Libratus”的卡耐基梅隆大学教授桑德霍尔姆在接受媒体采访时就持有异议,他认为“DeepStack”并未与最顶尖的人类选手比赛,所以暂时不能说是“超越”了人类。

责任编辑:陈群(QT0001)