北京时间12月7日早间消息,Alphabet旗下人工智能部门DeepMind一年前宣布开发了一套名为AlphaZero的系统,它可以教会自己如何掌握国际象棋、日本将棋和中国围棋,而且都能击败世界冠军。
虽然DeepMind的说法令人印象深刻,但当时却未能通过同行评审。不过,DeepMind今天宣布,经过数月的反复修订,该公司在AlphaZero上的成果已经被《科学》杂志接受,并登上该杂志的首页。
“几年前,我们的AlphaGo以4:1击败了18次获得围棋世界冠军的棋手李世石。但对于我们来说,这实际上是构建一个通用学习系统的开始,这个系统可以自己学习不同的游戏,最终达到超越人类的水平。“AlphaZero的首席研究员大卫·西尔沃(David Silver)对参加蒙特利尔NeurIPS 2018大会的记者说,“AlphaZero是这一段旅程的下一步。它从头开始学习击败围棋、国际象棋和日本将棋的世界冠军。除了游戏规则外,它什么知识都没有。“
Silver解释说,选择这些游戏既考虑了它们的复杂性,也考虑了之前针对它们进行人工智能研究的丰富历史。
为此,本周发表的论文描述了DeepMind如何利用深度神经网络实现优于Stockfish、Elmo和IBM深蓝的游戏算法。
“传统引擎非常强大并且几乎没有明显的错误,但当面对没有具体和可计算解决方案的位置时,可能会发生漂移。”国际象棋大师马修·萨德勒(Matthew Sadler)说,“正是在这样的位置,AlphaZero才能实现‘感觉’,‘洞察力’或‘直觉’。“
为了测试经过全面训练的AlphaZero,除了其前身AlphaGo Zero之外,DeepMind的研究人员还对上述的Stockfish和Elmo游戏引擎进行了测试。在具有44个处理器内核和4个谷歌第一代TPU的单台机器上运行时,AlphaZero都能轻松赢得大多数比赛。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。