dq8赌场在哪里

百度视频

2018-10-22

字号

选自arXiv作者:David Silver等在 DeepMind 发表 Nature 论文介绍 AlphaGo Zero 之后,这家公司一直在寻求将这种强大算法泛化到其他任务中的可能性。昨天,AlphaGo 研究团队提出了 AlphaZero:一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法。据称,新的算法经过不到 24 小时的训练后,可以在国际象棋和日本将棋上击败目前业内顶尖的计算机程序(这些程序早已超越人类世界冠军水平),也可以轻松击败训练 3 天时间的 AlphaGo Zero。AlphaZero 为何如此强大?机器之心对论文全文进行了编译介绍,希望能以此带你一探究竟。8 个小时训练击败李世石版本AlphaGo12 小时训练击败世界顶级的国际象棋程序 Stockfish14小时训练击败世界顶级将棋程序 Elmo计算机国际象棋和计算机科学本身一样古老。查尔斯·巴贝奇、艾伦·图灵、克劳德·香农和冯诺依曼都曾设计硬件、算法以及理论来让计算机分析和玩国际象棋。国际象棋随后成为了一代人工智能研究者努力希望克服的挑战,最终,我们也实现了超越人类水平的国际象棋程序。然而,这些程序高度局限于它们所处的领域,在没有人类大幅度修改的情况下,无法被泛化去处理其他任务。创造可以以简单规则为基础不断自我学习的程序一直是人工智能领域的重要目标。最近,AlphaGo Zero 算法在围棋上实现了超过人类水平的成绩,而背后使用的是卷积神经网络,只通过强化学习进行自我对弈训练。在本论文中,DeepMind 实现了类似但完全泛化的算法(fully generic algorithm)——在未输入游戏规则以外任何知识的情况下,其推出的全新算法 AlphaZero 在国际象棋和日本将棋上实现了和围棋同样的高水平。DeepMind 宣称该研究证明了 AlphaZero 作为一个通用性强化学习算法可以从零开始,在多种具有挑战性的任务上实现超越人类的水平。
dq8赌场在哪里
责任编辑:宿绍军剧常坤新闻报料:4009-0-6124   未经授权不得转载
关键词 >> dq8赌场在哪里

继续阅读

评论(7647)

追问(1061)

热新闻

绝对的好奇心来源天星资本

新闻APP下载

客户端下载

热话题

金沙国际娱乐热门推荐

关于thepaper网联系我们版权声明金沙国际娱乐广告友情链接