网易首页 > 网易科技 > 网易科技 > 正文

2017年,AI在人类设计的所有游戏中都打败了人类

0
分享至

本文系网易智能工作室(公众号 smartman 163)出品。聚焦AI,读懂下一个大时代! 

【网易智能讯 12月28日消息】在20世纪的大部分时间里,国际象棋是人工智能研究人员的一个基准。早在上世纪50年代初,约翰•麦卡锡提出了“人工智能”一词,他曾把国际象棋称为“人工智能领域的果蝇”,这一说法来源于早期对果蝇的研究对遗传学领域的影响。

上世纪90年代末,IBM的“深蓝”与世界冠军加里•卡斯帕罗夫进行了一系列国际象棋比赛。

在1997年,深蓝最终击败了卡斯帕罗夫,这是机器第一次在比赛中击败世界冠军。到本世纪早中期,这项技术已经进步到了一定程度,在几乎所有不同玩法的游戏中,机器都在不断地打败国际象棋大师。

自然而然地,人工智能开发者开始转向其他更复杂的游戏,以测试他们日益复杂的算法。在过去的12个月里,人工智能跨越了一系列的新门槛,最终在各种不同的游戏中击败了人类玩家,从古老的围棋游戏到动态互动的纸牌游戏,德州扑克。

从国际象棋到围棋

上世纪90年代末,机器终于彻底打败了国际象棋大师后,一位来自普林斯顿的天体物理学家评论说,“可能要等上一百年,电脑才能在围棋中打败人类——甚至可能更长。”

于是计算机科学家们又把研究的注意力转向围棋,这是一个来自中国的古老的策略游戏,非常容易学会,但是很难做到精通。

在过去的十年中,机器学习的发展创造了真正有竞争力的人工智能围棋选手。2014年,谷歌开始开发一个名为AlphaGo的深度学习神经网络。在经历了几年的接近成功之后,开发团队尝试了一些不同的东西。

在2016年末,一个名为“Master”的神秘网络围棋选手出现在了亚洲热门游戏服务器Tygem上。在接下来的几天里,这个神秘的玩家在于许多世界冠军的比赛中占据了主导位置。到2017年1月4日,官方确认“Master”实际上是DeepMind的AI AlphaGo的最新版本。

2017年5月,AlphaGo “Master”打败了柯洁——世界上排名第一的围棋选手。在AlphaGo和柯洁对战的三场比赛中,这台机器一直处于优势地位,但最令人吃惊的是,在10月份的时候,谷歌已经研究出了一个比“Master”更先进的AlphaGo版本。

根据《自然》杂志的一篇文章中,AlphaGo Zero是一种革命性的算法,它能够迅速地自学围棋。这个系统一遍又一遍地与自己对战,掌握了不同情况下的游戏方法。经过21天的学习,AlphaGo Zero已经达到了“Master”的水平。40天后,它就已经超过了之前所有版本的技能水平。

到2017年12月,DeepMind推出了一个更先进的系统版本。这款名为AlphaZero的新人工智能可以在几小时内掌握多种游戏。经过8个小时的自我训练,该系统不仅可以击败之前的AlphaGo Zero,还可以完全掌握国际象棋和日本将棋。

掌握扑克牌中的“欺诈”术

尽管围棋游戏的复杂度已经非常之高,但对于人工智能来说,围棋和扑克采用是两种完全不同的模式。要想在扑克游戏中取胜,你需要掌握一定的欺诈技能。欺诈以及识别他人的欺诈是在纸牌游戏中取胜需要掌握的关键技能。

经过十多年的尝试,在2017年,两项独立研究显示,人工智能终于打败了一流的扑克牌专业人士。来自加拿大阿尔伯塔大学的研究人员推出了一个人工智能系统,DeepStack,它可以用一种人工智能形式的“直觉”来全面控制人类扑克玩家。

After a grueling 20-day marathon, the machine has comprehensively thrashed all four professional poker players

卡内基梅隆大学的一个研究小组在2017年1月举办了一场更加公开的活动,当时它的Libratus AI系统花了20天时间,与四名专业的扑克玩家一起玩了12万局无限注“德州扑克”。尽管专业人士每天晚上都在讨论他们可以利用人工智能的哪些弱点,但这台机器每天都在改进自身,修补游戏玩法中的漏洞,改进策略。

人类的大脑无法与机器匹敌,在经过近一个月的不间断游戏之后,这台机器总共赢了170万美元,而这4位专业人士中的每一位都损失了数千美元的虚拟货币。其中一名专业玩家对《连线》杂志说:“在这次激烈的比赛中,我感觉自己在和一个作弊的人比赛,就好像我的牌可以被他看到一样。我不是在指责它作弊。这其实是一件好事。”

埃隆·马斯克的AI研究

2015年,埃隆•马斯克和一小群投资者成立了一个名为OpenAI的项目。该项目旨在探索人工智能系统的发展,尤其是在强化学习方面。在这种系统中,机器可以教会自己如何在特定的任务中提高自己的能力。

2017年8月,OpenAI团队将目光投向了征服Dota 2,这是一场名为“The International”的大型电子竞技锦标赛中的核心比赛。Dota 2是一款非常受欢迎且非诚复杂的多人在线对战游戏,在竞技游戏领域是一项严肃的比赛。

在仅仅两周的学习之后,OpenAI机器人就加入到了这场锦标赛中,随后击败了世界上的几名顶尖选手。目前人工智能系统只被训练过较为简单的一对一版本的游戏,但OpenAI团队正在研究如何让AI掌握五对五的“团队”游戏。

AI通过分工玩转“吃豆人”游戏

几年前,谷歌DeepMind对其人工智能在49款雅达利2600的游戏中进行了训练。只要有和人类玩家相同的输入,AI就会知道如何玩这些游戏并在游戏中获胜。事实证明,有些游戏确实比其他游戏更难以驾驭,在这些经典的、众所周知非常困难的游戏中,20世纪80年代的一款电子游戏“吃豆人”尤其具有挑战性。

2017年,谷歌收购了一家名为Maluuba的深度学习创业公司,并将其并入DeepMind。Maluuba的新型机器学习方法被称为“混合式奖赏架构”(HRA)。将这种方法应用到吃豆人系统中,该系统创建了150多个个体代理,每一个都有特定的目标——比如找到一个特定的豆子,或者避免幽灵。

HRA方法生成一个高级代理,类似于高级经理。在做出每一步的最终决定之前,这个高级代理会评估所有来自下级代理的建议。这种方法被委婉地称为“分而治之”,即把复杂的任务分解成更小的部分。

在将这个方法应用到吃豆人之后,AI很快就掌握了如何获得999990分的高分,这是之前没有人或人工智能能做到的。

AI将开始设计游戏

如果人工智能能在几乎每一场比赛中击败我们,那我们下一步该干什么?

法尔茅斯大学的一名研究人员最近公布了一种机器学习算法,他声称这一算法可以为我们创造出自己的游戏,我们从零开始玩游戏。这个人工智能系统名为Angelina,它每天都在不断改进自己,但目前它已经可以利用从维基百科共享到在线报纸以及社交媒体等各种来源的数据集制作游戏。

那么这一切意味着什么呢?

也许2017年最重大、最可怕的发展是强化学习系统的巨大进步。这些程序可以有效地教会它们自己如何掌握新技能。例如,最近的AlphaZero迭代可以在几天的自主学习之后,在一些游戏中获得超能力。

一项对350多名人工智能研究人员进行的大规模调查显示,人工智能还不足以打败我们。这项调查预测,在10年内,人工智能将会比我们更优秀,到2049年它将能够写出一部畅销小说,到2053年,它将会比人类在外科手术中表现的更好。事实上,该调查得出的结论是,到2060年,人工智能将有50%的几率能够完成我们所能做的所有事情,并且效果会更好。

2017年无疑是人工智能在日益复杂的游戏中打败人类的里程碑式的一年,尽管这看起来是一项微不足道的成就,但它的影响是巨大的。许多这些人工智能开发公司正迅速将目光投向现实世界的挑战。

谷歌DeepMind已经将AlphaGo Zero的系统应用到了其他领域,并进行了一项有关蛋白质折叠的全面研究,以期揭示治疗阿兹海默和帕金森等疾病的治疗方法。

“最终,我们希望利用像这样的算法突破来帮助解决各种现实世界问题中亟待解决的问题,”DeepMind的共同创始人兼首席执行官杰米斯•哈扎比斯(Demis Hassabis)说,“如果类似的技术可以应用于其他结构性问题,比如蛋白质折叠、减少能源消耗或寻找革命性新材料,那么取得的突破将有可能加强人类对这个世界的理解,并对我们所有人的生活产生积极影响。”

(选自:NEW ATLAS 编译:李擎 原链:https://newatlas.com/ai-2017-beating-humans-games/52741/)

相关推荐
热点推荐
博世称问界M7涉事车辆并未搭载博世智驾系统

博世称问界M7涉事车辆并未搭载博世智驾系统

鞭牛士
2024-04-28 17:32:15
“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

星辰故事屋
2024-03-08 21:12:51
再回安联!安帅执教拜仁遭5名老将反对后下课,罗本直言训练量少

再回安联!安帅执教拜仁遭5名老将反对后下课,罗本直言训练量少

直播吧
2024-04-28 19:08:12
布林肯连夜离开,落地美国后突然表态,情况比很多人想的都要麻烦

布林肯连夜离开,落地美国后突然表态,情况比很多人想的都要麻烦

娱乐的小灶
2024-04-28 17:39:12
董军在上合见7国防长,唯独没搭理印度,苏杰生的担忧正成为现实

董军在上合见7国防长,唯独没搭理印度,苏杰生的担忧正成为现实

说天说地说实事
2024-04-28 17:27:47
花990万拍下周鸿祎二手迈巴赫的男子系北京二手车商,曾喊话“1000咱都要”,笑称没有超过预算

花990万拍下周鸿祎二手迈巴赫的男子系北京二手车商,曾喊话“1000咱都要”,笑称没有超过预算

极目新闻
2024-04-28 21:17:03
福建舰再“现身”,这一细节释放重要信号!

福建舰再“现身”,这一细节释放重要信号!

直新闻
2024-04-28 22:00:09
国际奥委会主席:2036年奥运会有两位数的城市申请申办!

国际奥委会主席:2036年奥运会有两位数的城市申请申办!

AI商业论
2024-04-28 19:47:34
回族女性为什么要剃毛,何为剃毛?是有什么原因吗?

回族女性为什么要剃毛,何为剃毛?是有什么原因吗?

牛锅巴小钒
2024-04-28 16:03:55
美国大选,义乌“押注”谁?商家:有客户下单100万顶特朗普帽子

美国大选,义乌“押注”谁?商家:有客户下单100万顶特朗普帽子

时代周报
2024-04-28 17:38:05
曝上海市公共卫生临床中心主任范小红遭控诉:不作任何协商,迫使科研人员搬离实验室

曝上海市公共卫生临床中心主任范小红遭控诉:不作任何协商,迫使科研人员搬离实验室

互联网大聪明
2024-04-28 13:16:19
台媒称:缅甸克钦邦有意加入中国,并提出了极为苛刻的条件

台媒称:缅甸克钦邦有意加入中国,并提出了极为苛刻的条件

青年的背包
2024-04-28 11:36:57
问界M7碰撞起火3人遇难,这时我才看懂了华为智选模式

问界M7碰撞起火3人遇难,这时我才看懂了华为智选模式

闲醉山人
2024-04-28 16:43:23
闹大了!骆家辉直言不讳:中国自主生产尖端芯片,美国或有大动作

闹大了!骆家辉直言不讳:中国自主生产尖端芯片,美国或有大动作

搞笑的阿票
2024-04-28 17:30:03
深夜突发王炸利好,比降印花税还要劲爆!A股周一或一柱擎天

深夜突发王炸利好,比降印花税还要劲爆!A股周一或一柱擎天

奔走的股市
2024-04-28 13:37:12
“新冠疫苗之父”杨晓明被抓!个人履历曝光,评论区彻底失控!

“新冠疫苗之父”杨晓明被抓!个人履历曝光,评论区彻底失控!

古希腊掌管松饼的神
2024-04-28 09:10:08
热搜第一!鸡被砸死、美女隆起大包…广州龙卷风已致5死33伤

热搜第一!鸡被砸死、美女隆起大包…广州龙卷风已致5死33伤

魔都囡
2024-04-28 01:55:27
习主席用这句古语,点中了布林肯的“心思”

习主席用这句古语,点中了布林肯的“心思”

直新闻
2024-04-26 22:39:10
重庆燃气事件调查结果出炉;一季度全国电力燃气等行业利润增长40.0%;网传上海电力正在裁员

重庆燃气事件调查结果出炉;一季度全国电力燃气等行业利润增长40.0%;网传上海电力正在裁员

小萝卜丝
2024-04-28 17:25:22
不爱国?无人在乎神舟十八号发射,网友:房贷、车贷把我压垮!

不爱国?无人在乎神舟十八号发射,网友:房贷、车贷把我压垮!

鹏飞深文
2024-04-28 14:16:14
2024-04-28 23:06:44

科技要闻

特斯拉生死时速,马斯克西天取经

头条要闻

美国大选下的义乌"押注":有人下单100万顶特朗普帽子

头条要闻

美国大选下的义乌"押注":有人下单100万顶特朗普帽子

体育要闻

湖人的G4,尽人事得到了回报

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

上财万字报告深度解读Q1经济

汽车要闻

鸿蒙首款行政旗舰轿车 华为享界S9实车亮相车展

态度原创

本地
数码
健康
公开课
军事航空

本地新闻

云游中国|苗族蜡染:九黎城的“潮”文化

数码要闻

安克推出猫和老鼠联名苹果 iPad 手写笔:支持磁吸充电,208 元

春天野菜不知不识莫乱吃

公开课

父亲年龄越大孩子越不聪明?

军事要闻

也门胡塞击落美军"死神"无人机 并展示残骸

无障碍浏览 进入关怀版
×