下一代alphago,裸体测试也能拿到满分

2021-01-06 16:59   来源: 互联网

由谷歌母公司Alphabet拥有的DeepMind本月已经采取了很多举措。


首先,本月初,蛋白质结构预测AI--AI--AlphaFold 2赢得了CASP竞赛的冠军,解决了困扰学术界50年的问题:生物学家AndreiLupas自己花了十年时间用各种实验方法找出蛋白质的折叠形状,但在AlphaFold 2的帮助下,他在半小时内就得到了答案。


然后,月底,DeepMind在"自然"杂志上发表了一篇论文,介绍了AlphaGo,MuZero的高级版本。简单地说,MuZero更"通用"。它精通国际象棋、围棋、普通象棋,在数十款Atari游戏中完全超越了以往的人工智能算法和人类。但更具有革命性的是,木零不像它的祖先,在下棋和玩游戏之前根本不知道游戏规则,而是通过自己的实验和摸索形成自己的决定,洞察国际象棋和游戏规则。换句话说,AI将"使用他自己的头脑"。


image.png


MuZero就像Netflix热剧"皇后的国际象棋"(The Queen‘s Chess)中的贝丝·哈蒙(Bess Harmon)。他一点也不知道国际象棋的规则,他用几个观察结果"画出"棋盘",不断回顾国际象棋比赛,增强了她的直觉,最终变得无敌。


我不知道规则,我怎么赢国际象棋?


AlphaGo出生于2016年,在2017年乌镇围棋峰会上击败了韩国顶级国际象棋选手李石(Lee Shik)和世界上第一位国际象棋选手克杰(音译)。中国围棋协会(China Go Association)甚至立即授予了AlphaGo职业围棋(AlphaGo)九段的称号。


AlphaGo依赖于DeepMind输入的专家象棋数据集,然后它的继任者AlphaGoZero开始摆脱对"人类数据"的依赖,并开始通过多种自我游戏积累所需的数据。2018年年底发布的AlphaZero在前两个版本上进行了迭代。除此之外,它还学会了下棋和下棋。令人惊讶的是,AlphaZero只用了24小时就能看到棋盘,成为世界级的国际象棋大师。


但你不能就像下棋那样向前看。你必须学会这个世界是如何运作的。DeepMind的首席研究科学家戴维-西尔弗告诉"连线"记者,他们决定不告诉AI如何提前获胜。"这是我们第一次建立这个系统。


上面提到的"Alpha"家族首先需要"人工数据"、"领域知识"和"游戏规则",或者至少依赖于"游戏规则"。另一方面,MuZero没有这种知识储备,就像下棋是蒙着眼睛玩游戏一样。

责任编辑:无量渡口
分享到:
0
【慎重声明】凡本站未注明来源为"5G科技网"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行!