网易首页 > 网易科技 > 智能硬件 > 正文

AlphaGo新版本问世:自学40天就能胜赢柯洁的版本

0
分享至

网易科技讯 10月19日消息,专注于推进人工智能(AI)研究的谷歌子公司DeepMind今天发布了一款新版本的AlphaGo程序,它能通过自学玩转多种游戏。这套系统名为“AlphaGo Zero”,它通过一种名为“强化学习”的机器学习技术,可以在与自己游戏中吸取教训。

仅三天时间,AlphaGo Zero自行掌握了围棋的下法,还发明了更好的棋步。这期间,除了被告知围棋的基本规则,它未获得人类的帮助。随着AlphaGo Zero被不断训练时,它开始在围棋游戏中学习先进的概念,并挑选出一些有利的位置和序列。

经过三天的训练,该系统能够击败AlphaGo Lee,后者是去年击败了韩国选手李世石(Lee Sedol)的DeepMind软件,胜率是100比0。。经过大约40天的训练(约2900万场自玩游戏),AlphaGo Zero击败了AlphaGo Master(今年早些时候击败了世界冠军柯洁)。

旧版AlphaGo接受的训练是,观摩由实力强大的业余或专业棋手对弈的海量棋局。但AlphaGo Zero没有获得这样的帮助。它自我对弈数百万次,并从中学习。一开始,它只是随意把棋子放在棋盘上,但后来它发现了获胜的策略,棋艺就快速提升了。

AlphaGo的首席研究员大卫·席尔瓦(David Silver)表示,“由于未引入人类棋手的数据,AlphaGo Zero远比过去的版本强大,我们去除了人类知识的限制,它能够自己创造知识。”

AlphaGo Zero通过“强化学习”这一程序来积累技能。当AlphaGo Zero走出一步好棋,它更有可能获胜。若这步棋没走好,它输棋的概率变大了。

这一程序的核心是一组连在一起形成人造神经网络的 “神经元”。对于棋局的每个回合,神经网络会观察棋子在棋盘上的位置,并推算接下来的棋步以及这些棋步让全盘获胜的概率。每次对弈后,它会更新神经网络,让棋艺更精进。虽然性能远胜于以前的版本,但AlphaGo Zero是一个更简单的程序,掌握棋法的速度更快,接受训练的数据更少,使用的电脑更小。席尔瓦表示,如果拥有更多的时间,AlphaGo Zero还能够自己学会围棋规则。

研究团队在《自然》杂志上发表的文章写道,一开始AlphaGo Zero的棋艺糟透了,后来它逐渐成为一名缺乏经验的业余棋手,最终进阶为围棋高手,能够走出极具战略性的棋步。这些进步仅花费了几天时间。最初10小时内它就发现了一个定式。随后不久它又领悟了一些棋法。三天后,AlphaGo Zero发现了人类专家正在研究的全新棋步。有趣的是,程序在发现更简单的棋步之前就早已掌握了一些复杂棋步。

这一进展标志着通用型AI发展的大一里程碑。除了下棋赢过人类,通用型AI能做更多事情。由于AlphaGo Zero能够从一无所知实现自学成才,如今其天赋可以在诸多现实问题上派上用场。

AlphaGo Zero正在研究蛋白质如何折叠的问题,这是一个艰难的科学挑战,不过有望成为药物发明的一大突破。

(丹米斯·哈撒比斯)

DeepMind的CEO丹米斯·哈撒比斯(Demis Hassabis)表示,“对我们来说,AlphaGo不仅限于在围棋对弈中获胜,这也是我们开发通用算法的一大进步。”大多数AI被认为“用途有限”,因为它们只能执行单一任务,例如,翻译、识别面孔。但通用型AI在许多不同任务上拥有超越人类的潜能。哈撒比斯认为,在接下来十年,AlphaGo的迭代产品将成为科学家和医学专家,与人类并肩工作。

此外,AlphaGo Zero比它的许多前辈都要高效得多。AlphaGo Lee需要使用几台机器和48个谷歌张量处理单元机器学习加速器芯片,该系统的早期版本AlphaGo Fan需要176个GPU。而AlphaGo Zero和AlphaGo Master一样,只需要一台机器和4个TPU。(惜辰)

相关推荐
热点推荐
赵睿11中6砍17+5多次戏耍小姚明 新疆拿周琦换值了 官方炫耀表现

赵睿11中6砍17+5多次戏耍小姚明 新疆拿周琦换值了 官方炫耀表现

厝边人侃体育
2024-05-02 21:37:23
失察、失控、失策、失职,住建、规划、发改委等相关部门难辞其咎

失察、失控、失策、失职,住建、规划、发改委等相关部门难辞其咎

娱乐圈见解说
2024-04-29 13:32:05
老杜又被许敏告了,她找到了三个制胜点,宣称不用请律师也能赢

老杜又被许敏告了,她找到了三个制胜点,宣称不用请律师也能赢

华庭讲美食
2024-05-03 14:30:05
深夜,中国资产全线爆发!黄金、白银跳水

深夜,中国资产全线爆发!黄金、白银跳水

证券时报e公司
2024-05-02 22:45:52
哈马斯交底:人质基本没了,放弃武装!以承认巴、巴不承认以!

哈马斯交底:人质基本没了,放弃武装!以承认巴、巴不承认以!

冠世
2024-04-30 22:51:42
最高9.7分,零差评,这五部神作值得一看

最高9.7分,零差评,这五部神作值得一看

美剧院线
2024-05-01 17:01:28
破案了!张镇麟隔扣徐昕,为何嘴里还骂骂咧咧很愤怒?杨鸣长经验

破案了!张镇麟隔扣徐昕,为何嘴里还骂骂咧咧很愤怒?杨鸣长经验

体育大学僧
2024-05-02 12:07:11
有性生活的人和没有性生活的人,竟有如此多不同,看完涨知识了

有性生活的人和没有性生活的人,竟有如此多不同,看完涨知识了

肿瘤的真相与误区
2024-04-28 19:43:36
福建男医生陪妻子做孕检,孩子出生后,向她注射16支胰岛素

福建男医生陪妻子做孕检,孩子出生后,向她注射16支胰岛素

一场奇遇日记
2024-04-15 21:03:26
退休后,如果你连一个朋友都没有,说明了你有这3个问题

退休后,如果你连一个朋友都没有,说明了你有这3个问题

户外阿崭
2024-05-03 07:59:42
美媒评火箭队史最佳选秀:姚明遗憾落选 卡佩拉第3 帕森斯高居第2

美媒评火箭队史最佳选秀:姚明遗憾落选 卡佩拉第3 帕森斯高居第2

锅子篮球
2024-05-02 23:19:01
一个国家被踢出SWIFT系统的后果非常的严重!

一个国家被踢出SWIFT系统的后果非常的严重!

华夏司马北
2024-04-24 22:01:49
男子患病四年,嘴臭如粪,去医院检查发现脑中竟藏着一把10cm长刀

男子患病四年,嘴臭如粪,去医院检查发现脑中竟藏着一把10cm长刀

爆史君带你读历史
2024-05-02 21:49:06
中超第10轮,上海申花-浙江,前瞻: 连胜节奏

中超第10轮,上海申花-浙江,前瞻: 连胜节奏

足坛超短波
2024-05-03 10:50:03
隆多:绿军三巨头中KG牺牲最大 他和詹姆斯是我合作过最自律的人

隆多:绿军三巨头中KG牺牲最大 他和詹姆斯是我合作过最自律的人

直播吧
2024-05-03 14:41:08
网友偶遇孙卫东博士,已能正常生活,开始学习电脑,本人状态不错

网友偶遇孙卫东博士,已能正常生活,开始学习电脑,本人状态不错

象牙三
2024-05-02 14:12:00
海外谈中国:轰-6K发射一枚神秘的弹道导弹 让美国专家感觉恐惧

海外谈中国:轰-6K发射一枚神秘的弹道导弹 让美国专家感觉恐惧

hawk26讲武堂
2024-05-02 15:12:16
来上海必吃的8家“百年老字号”,本地人从小吃到大,没吃白来了

来上海必吃的8家“百年老字号”,本地人从小吃到大,没吃白来了

多思味
2024-05-03 17:09:20
背美,是世界上最美的

背美,是世界上最美的

农人老寓
2024-05-03 13:58:21
5月3号下午,消息面不得了,突然曝出一大消息,要来大动作吗

5月3号下午,消息面不得了,突然曝出一大消息,要来大动作吗

股市皆大事
2024-05-03 11:27:04
2024-05-03 17:48:49

科技要闻

火箭起飞,整流罩分离!直击嫦娥六号发射

头条要闻

广东肇庆推新政 5月起商品房按套内面积计价宣传销售

头条要闻

广东肇庆推新政 5月起商品房按套内面积计价宣传销售

体育要闻

没有詹杜库的季后赛次轮

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

远超想象?"股神"巴菲特的AI投资布局

汽车要闻

北京车展上的概念车,AI如何点评?小米SUV发布?

态度原创

数码
亲子
艺术
本地
公开课

数码要闻

AMD 发布新 AGESA 固件更新,修复影响Zen 2处理器的Zenbleed漏洞

亲子要闻

爸妈不在家,3岁哥哥独自带着1岁妹妹,这一幕太有爱了

艺术要闻

造科幻之物于园林 “天工开悟——夏航雕塑展”于南池子美术馆呈现

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版
×