就在之前10月19日,Deepmind在Nature发布了一篇论文。
在这篇名为《Mastering the game of Gowithout human knowledge》(不使用人类知识掌握围棋)的论文中,Deepmind展示了他们更强大的新版本围棋程序“AlphaGo Zero”,验证了即使在像围棋这样最具挑战性的领域,也可以通过纯强化学习的方法自我完善达到目的。
文章声称其创造的“阿尔法元”(AlphaGo Zero)计算机程序在3天内学会了其前身阿尔法狗(AlphaGo)需要半年多时间学习的东西,吸收了超过10万份的人类围棋游戏的数据。
业务联系:400-188-3918 150-361-89691
郑州云海计算机技术有限公司版权所有,未经授权禁止复制或建立镜像.