网易首页 > 网易科技 > 网易科技 > 正文

Google DeepMind团队在《自然》杂志发表论文,公布玩游戏比人厉害的AI是如何做出来的

0
分享至


电脑会玩游戏已经不算稀奇,比方说,一般人玩棋类游戏已经玩不过计算机了。但如果事先不告诉计算机应该怎么玩,而只是给它提供这三样东西:控制器、显示器、游戏得分,让它看着显示器的显示控制控制器,然后要求它尽可能得高分,那基本上大部分的AI就一筹莫展了。

所以,当2013年12月DeepMind的团队首次展现他们靠不断试错学习最后成为击败人类专业玩家的游戏高手AI时,许多在场的AI专家都感到有些震惊。这些AI靠着对游戏视频的观察来寻找出模式,然后操作控制器,并获得得分的反馈结果(高分奖励)。在反馈中不断调整自己的控制,最后AI完全靠自学而不是编码学会了玩49种Atari视频游戏,其中43种游戏玩得比之前的AI都要好;并在23种游戏中击败了人类的职业玩家。这些游戏当中,简单的弹球和拳击游戏AI玩得最好,但是像经典的消砖块Breakout游戏也能玩得很好,甚至还学会了打开一条通道让球跑到后面去消掉砖块(参见下面视频,注意观察AI如何在游戏中改进自己的策略),这种技巧往往只有老练的玩家才会。许多研究人员1年后对他们如何做到仍感到困惑不已。不过现在他们不用困惑了,因为DeepMind团队现在已经在《自然》杂志上公布了自己的研究成果:Human-level control through deep reinforcement learning—通过深度强化学习实现人类水平的控制。

总的说来,DeepMind的AI的设计核心是如何让计算机自行发现数据中存在的模式。其解决方案是深度神经网络与强化学习等方法的的结合。AI并并不知道游戏规则,而是用深度神经网络来了解游戏的状态,找出哪一种行为能导致得分最高。尽管利用模拟神经网络来教电脑玩游戏(如军棋游戏)的方法已经使用了几十年,但是从未有人能像DeepMind团队那样以如此有用的方式结合到一起,智能系统普朗克学院的Bernhard Sch lkopf主任称,其方案展现出了令人印象深刻的可适应性。

这一方面是得益于现在计算能力的提高使得AI可处理规模要大得多的数据集,要知道,观察Atari游戏相当于每秒处理200万像素的数据。另一方面则是得益于DeepMind结合了强化学习来训练AI,而且是在高维度感觉输入中采用的端到端强化学习。相对于以往计算机会玩的游戏,如国际象棋等,这次计算机玩的游戏更接近现实世界的混沌状态。Google的智能设计师Demis Hassabis称,这是第一种能在一系列复杂任务当中与人类表现相当的算法。

那么Google会不会用这种AI来分析自己的大规模数据集呢?Hassabis并没有给出任何肯定的说法,但称该系统对任何连续性决策任务都有用。如果我们把Google收集的用户数据比作像素,把广告收入比作得分的话,DeepMind的AI系统一样也可以用在比如Google的核心广告业务。让AI去置放的广告,点击率越高就给它更高的分数,这样AI能够不断演进优化广告的投放算法。而伦敦大学金斯密斯学院的Michael Cook甚至给出了确切的数字,称Google已经在7款产品中采用了DeepMind的技术。其中会不会包括Google研发的自动汽车呢?也许用不了多久我们就能感受到有了那颗DeepMind支撑的产品的表现差异了。

[消息来源:nature.com, newscientist.com, theverge.com]

相关推荐
热点推荐
中国现在的主要矛盾到底是什么?

中国现在的主要矛盾到底是什么?

江平舟
2024-03-28 18:14:26
报应来了!反华国家宣布破产,欧美拒绝救援,服软向中方借200亿

报应来了!反华国家宣布破产,欧美拒绝救援,服软向中方借200亿

环球Talk
2024-02-27 23:48:25
11年前小夫妻双双遇难,却留下4枚冷冻胚胎,如今的结果怎么样了

11年前小夫妻双双遇难,却留下4枚冷冻胚胎,如今的结果怎么样了

大头乖啊i
2024-03-28 12:15:51
民进党出来表态了,民进党作出重大的妥协!

民进党出来表态了,民进党作出重大的妥协!

杂谈天下式
2024-03-28 15:32:03
180万拆迁款留给儿子,女儿断绝关系,5年后母亲上门:帮弟弟还债

180万拆迁款留给儿子,女儿断绝关系,5年后母亲上门:帮弟弟还债

安妮Emotiong
2024-03-28 16:17:16
仁川冠军赛:女单首个8强诞生!早田希娜3-1乒坛名将,坐等孙颖莎

仁川冠军赛:女单首个8强诞生!早田希娜3-1乒坛名将,坐等孙颖莎

小鬼头体育
2024-03-29 16:36:06
广东男子到江苏东台吃早茶,结账时确认三遍不敢相信,没算错吧?

广东男子到江苏东台吃早茶,结账时确认三遍不敢相信,没算错吧?

马蹄烫嘴说美食
2024-03-29 07:55:08
李斌道歉之后,蔚来老板娘,也向刘强东的奶茶妹妹道歉了

李斌道歉之后,蔚来老板娘,也向刘强东的奶茶妹妹道歉了

涛涛生活搞笑
2024-03-29 09:30:12
伊万刚带国足4比1大胜,就跟郑智摊牌,让他带中方教练组走人?

伊万刚带国足4比1大胜,就跟郑智摊牌,让他带中方教练组走人?

小鬼头体育
2024-03-29 16:59:28
雷军:我是特斯拉车主,也是保时捷车主,小米不可能全面碾压他们

雷军:我是特斯拉车主,也是保时捷车主,小米不可能全面碾压他们

三言科技
2024-03-27 13:36:05
8强争夺战开打,女乒晚上2场硬仗引人关注!1场与中国女乒有关

8强争夺战开打,女乒晚上2场硬仗引人关注!1场与中国女乒有关

星夜明瞳
2024-03-29 14:24:28
为保命,巨贪怒吼:判死刑,我就揭发!上诉被驳回,2011年被枪决

为保命,巨贪怒吼:判死刑,我就揭发!上诉被驳回,2011年被枪决

诗意世界
2024-03-29 10:15:03
曹云金正式道歉,称自己曾年轻气盛做错事,想要与郭德纲和解!

曹云金正式道歉,称自己曾年轻气盛做错事,想要与郭德纲和解!

花花lo先森
2024-03-29 14:51:41
勇士赛程:坏消息只有4场主场,好消息是有6场客场!

勇士赛程:坏消息只有4场主场,好消息是有6场客场!

体育大集
2024-03-29 16:54:58
活久见啊!森林狼老板:买家到期未付款 球队不再出售

活久见啊!森林狼老板:买家到期未付款 球队不再出售

直播吧
2024-03-28 23:10:14
德云社演员透露:郭德纲看到曹云金礼物慌了神,其他人看到也心酸

德云社演员透露:郭德纲看到曹云金礼物慌了神,其他人看到也心酸

七阿姨爱八卦
2024-03-28 22:51:10
老美曝80%大疆“芯”非国产,须罚60亿,业内:大疆根本不怕打压

老美曝80%大疆“芯”非国产,须罚60亿,业内:大疆根本不怕打压

科技龙
2024-03-28 16:42:39
单位里请牢记:只要你职位没动,工资按时发放,就不必太在意他人

单位里请牢记:只要你职位没动,工资按时发放,就不必太在意他人

侃故事的阿庆
2024-03-29 15:35:12
闹大了,原来是地磁暴啊,我还以为自己得了什么大病呢

闹大了,原来是地磁暴啊,我还以为自己得了什么大病呢

意外动物
2024-03-29 00:10:03
上将畏罪自杀,背后的“保护伞”背景深厚,最终结局令人出乎意料

上将畏罪自杀,背后的“保护伞”背景深厚,最终结局令人出乎意料

诗意世界
2024-03-23 16:30:46
2024-03-29 17:48:49

科技要闻

雷军:我们是卷王,建议BBA车主感受下时代

头条要闻

奥巴马和克林顿露面支持拜登 特朗普方称要搞场更大的

头条要闻

奥巴马和克林顿露面支持拜登 特朗普方称要搞场更大的

体育要闻

拒绝为国出战,他是足坛"天选打工人"

娱乐要闻

胡夏被曝有孩子!工作室火速辟谣

财经要闻

张维迎:如何正确理解企业家精神?

汽车要闻

找回久违的开怀大笑 试驾小米SU7 Max

态度原创

时尚
手机
健康
公开课
军事航空

刘亦菲的抱花照,该更新了!

手机要闻

华为三折叠屏手机专利公布,此前消息称最快今年 Q2 面世

早防早筛,远离肝硬化

公开课

30岁之前,你要学会的13件事情

军事要闻

乌方声称击落两枚俄"锆石"高超音速导弹 俄方未予回应

无障碍浏览 进入关怀版
×