网易首页 > 网易科技 > 网易科技 > 正文

OpenAI狂虐Dota大神Dendi,AI称霸游戏界这事你咋看

0
分享至


本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!

【网易智能讯8月14日消息】上周五晚,埃隆·马斯克OpenAI团队在电子竞技领域一鸣惊人,跃居成为世界上最伟大的选手之一。

据悉,在上周五Dota 2国际邀请赛上,Open AI的机器人在Dota2 1v1比赛中战胜了Dota人类顶级职业玩家Dendi。至此,继横扫人类国际象棋大师和围棋大师后,人工智能如今又将风靡全球的电子竞技游戏Dota2攻陷。

比赛期间,Open AI公司的机器人表现是非常“强悍”的,不仅会卡兵、s补刀,还会s掉技能抬手其进攻性超强,连续两局狂虐Dendi。如此“强悍”的Open AI机器人手法娴熟,出手“快”、“准”、“狠”,刀刀毙命,这不禁令Dendi求饶:“请放过我吧。”

针对此战情,马斯克很快就欢呼着发了推文,庆贺胜利。他写道:“OpenAI在竞争激烈的电子竞技领域中首次击败了世界上最优秀的选手。Dota 2比传统的棋类游戏复杂得多。”马斯克暗指自己的OpenAI机器人比AlphaGo更胜一筹。尽管OpenAI这款机器人绝对是了不起的——它展示了一种对职业玩家的统治地位,但机器人并不会取代Dendi在团队中的位置。

什么是Dota2?


《DOTA 2》是一款由Valve开发免费的多人在线战斗竞技类游戏,其前身是魔兽争霸三及扩展版本冰封王座中的一张自定义游戏地图。截至目前,Dota2是steam平台上活跃人数最多的游戏之一,最高在线人数超过120万。Dota2的游戏比赛在两个队伍间进行,每个队伍有五名玩家,每个队伍都有一条优势路。每个队伍的游戏目标是摧毁对面要塞中的远古遗迹。每个玩家从113位能力风格技能迥异的英雄中选择一位进行操控。在比赛中,玩家在相互对抗的过程中为各自的英雄收集金钱、经验及道具。

双方玩家将在一幅地图上争夺地盘,杀死对方小兵和电脑控制的其他游戏单位,以增强他们的力量,并试图杀死对方以给自身队伍带来益处。这些角色的特技不同,比如进攻、防守和支持,但是复杂多变的因素意味着人类棋手在几十种不同的风格、策略和角色中都只能扮演一个英雄。

战况回顾

然而,在1v1的模式中,两位玩家都被分配到同一个英雄——SF影魔,一个广受欢迎的进攻性英雄,被许多世界上最好的中路角色玩家所青睐。胜利的规则很简单——杀死对方两次或摧毁一座防御塔的玩家则获胜。“影魔”并不是Dendi玩的最好的英雄,但他仍然是这个角色的顶级玩家。本周早些时候,OpenAI报道称,他们的机器人击败了目前的1v1冠军Sumail(美籍巴基斯坦游戏玩家,曾获得过DOTA2第五届国际邀请赛冠军),以及世界上最好的中路玩家——Arteezy。

在这种格局的游戏中,OpenAI的机器人完全占据了主导地位。双方交锋过程中,在第一场比赛期间,主持人问Dendi:“你感觉它像一个‘人类选手’吗?”Dendi回答说:“不,这家伙真的很可怕。”他不停地说着,面对机器人放狠招,他还一度大叫“请放过我吧!”第一局比赛中,第一局Open AI机器人仅用10分钟就击败了Dendi(Dendi试图杀死机器人的同时,机器人杀死了他二次)。第二场比赛中,机器人在开场的几分钟内无情地痛打了他一顿,他便投降了主动放弃了比赛,并拒绝进行第三场比赛。

OpenAI的这款机器人频繁展示高超的战术,阻止较小的单位,引诱着Dendi进入陷阱,并积极地采用战略并利用它来惩罚Dendi。之前,Dota 2的计算机控制算法可以与人类选手相抗衡,但它们的编程却相对初级。在某种程度上,大多数专业人士都足够优秀,能够找到机器人游戏风格的策略和弱点,这样他们就可以轻松地开发和击败机器人。但是,这次的OpenAI机器人在上场之后几乎找不到弱点。

机器人构建

OpenAI机器人运行了一种改良版的机器学习算法,这意味着它会随着它的运行而进化和学习,并抛弃其代码的低级版本(该公司并没有具体地使用它的语言,但据一名程序员透露,这是一种遗传算法)。该机器人学会了玩游戏,不过这个游戏是要打败它自己。OpenAI Dota 2团队的负责人Greg Brockman说,在早期阶段,决斗的暗影恶魔只是在地图上毫无目的地四处乱跑直到他们死去,但慢慢地,他们学会了一些策略,让他们更接近设定的获胜目标。几周之后,他们就变得十分强大,足以击败专业选手。“这款机器人可以从零开始,在两周的时间内变得很强大,”他说。

“自我博弈”(self-play)是OpenAI研发的关键所在。据悉,这是一种用于学习和解决机器复杂任务的有效方法:与太强或者太弱的都手过招,它都无法从中学到任何东西,但是可以将自身作为竞争对手。这次的机器人完全是在自我博弈下进行针对训练的,并没有使用模仿学习或树搜索。

未来5V5不是“梦”

OpenAI挑战Dota 2背后的故事 (来源:网易科技频道)

据悉,Dota 1v1是含有隐藏信息的复杂游戏,智能体需要通过学习计划、进攻策略,并从中学会误导对手。玩家技巧和手速的关联性也不那么强烈了。而实际上,OpenAI的手速一般,和普通人类玩家大致相当。而要想在Dota中取胜,要求玩家培养出敏锐的直觉,并采取相应的应对措施。视频中,我们可以看到,该机器人已经通过自我博弈学会了预测其他选手的动作,并在不熟悉的场景下即兴发挥,刀刀毙命。面对Dota繁琐复杂的游戏规则,该机器人并没有丝毫的“怯场”,应用自如。在训练之初,AI对于自己的所处的世界一无所知,从零开始学习,进行自我博弈,这其实意味着它和它的对手永远旗鼓相当,并不断取得进步,进而达到职业选手的水平。

当然,1v1模式的Dota并不是真正的Dota。但这是一个次要问题,就像棒球里的全垒打一样。你可以制造一个俯仰的机器人,它可以一直扔出完美的快速球,但是,要想建立一个机器人棒球运动员团队是完全不同的事。无论是在编程方面,还是在最高级别的协调、沟通和战略方面,都面临着严峻的挑战。在完整的5v5版本游戏中,有成千上万的不定因素,那远比精简版的多很多——所以马斯克的胜利之声是在混淆实际的成就。不过,OpenAI并没有就此止步。该公司表示,“下一步是创建一个Dota 2机器人团队,这些机器人可以与顶尖的人类团队进行竞争和协作”。这意味着,如果它采用同样令人印象深刻的技术,明年的TI8可能会有一个完整的机器人挑战者团队。

真实的世界

Dota全球大赛上,Dendi挑战OpenAI记录 (来源:网易科技频道)

当然,这其中的含义是,能够掌握复杂视频游戏的机器人也可以有其他的用途。“我们所建立的是一个普遍的学习系统,尽管它在很多方面仍然受到限制,但它仍然能击败最优秀的人类专家,”Brockman说,“这是朝着向建立更通用的系统迈出的关键一步,它可以学习真正复杂的、重要的现实世界里的任务,比如做一名外科医生。”

向来以建设安全可靠的通用人工智能为己任的OpenAI,通过“自我博弈(Self-Play)”从零开始训练这款电子竞技机器人。赛前,Open AI CTO Brockman对外透露了该款机器人在Open AI的指导下经历了一千次比赛的训练。Brockman 还声称这个 bot 已经打败多个世界级职业玩家。接下来,该公司表示将要转战研究5V5,未来战胜人类世界级玩家不是“梦”。

OpenAI是我们工作的公司,其目标是确保这些强大的系统对我们所有人都是有益的。这也是马斯克计划的一部分。他的想法是,最终人工智能将比人类更聪明,而且人工智能必须在安全、受监管的情况下进行。“没有人喜欢受到监管,但所有对公众构成威胁的东西(汽车、飞机、食品、药品等)都必须要受到监管。人工智能也应该是这样的。”上周五晚,马斯克发表推文说道。

人工智能目前可能不会对社会造成多大威胁,但在Dota2的比赛中,它确实很可怕。(选自:Inverse  编译:网易见外智能编译平台 校对:田俊宏)

相关推荐
热点推荐
范丞丞进入北京电影家协会!姐姐阴阳怪气发言疑似姐弟关系闹掰

范丞丞进入北京电影家协会!姐姐阴阳怪气发言疑似姐弟关系闹掰

湖说鱼有料
2024-03-28 16:57:22
谁在造谣江苏南通禁止制造销售封建迷信殡葬用品是外部势力渗透

谁在造谣江苏南通禁止制造销售封建迷信殡葬用品是外部势力渗透

双色球的方向舵
2024-03-28 22:07:36
国乒最难打破的26项纪录,马龙一人独占一半,陈梦、刘诗雯上榜

国乒最难打破的26项纪录,马龙一人独占一半,陈梦、刘诗雯上榜

林子说事
2024-03-27 07:15:03
贝克汉姆夫妇:躺在自家游艇上晒太阳,48岁球星的手却不老实了!

贝克汉姆夫妇:躺在自家游艇上晒太阳,48岁球星的手却不老实了!

花花lo先森
2024-03-28 17:00:17
雷克萨斯4S店:新NX要来了!配置大升级,现款降8万甩卖

雷克萨斯4S店:新NX要来了!配置大升级,现款降8万甩卖

网上车市
2024-03-27 18:18:17
央视马上播出!接档追风者,阵容强大,提前拉满期待值!

央视马上播出!接档追风者,阵容强大,提前拉满期待值!

娱乐圈酸柠檬
2024-03-29 02:47:28
赵露思蕉内新代言

赵露思蕉内新代言

娱乐圈酸柠檬
2024-03-28 22:07:25
肺癌一查就是晚期?其实双腿早早给了暗示!有3个迹象,尽早筛查

肺癌一查就是晚期?其实双腿早早给了暗示!有3个迹象,尽早筛查

元芳
2024-03-21 09:15:48
两天之内两大一线城市释放楼市新大招,核心城市房价重回涨势?

两天之内两大一线城市释放楼市新大招,核心城市房价重回涨势?

王五说说看
2024-03-27 21:39:16
董路曾爆料:卓尔不想再给钱&李铁坚持要,卓尔董事长被惹急爆料

董路曾爆料:卓尔不想再给钱&李铁坚持要,卓尔董事长被惹急爆料

直播吧
2024-03-28 12:53:49
汪小菲求婚成功!又成台湾省女婿,晒钻戒表白,女方被指翻版大S

汪小菲求婚成功!又成台湾省女婿,晒钻戒表白,女方被指翻版大S

非常先生看娱乐
2024-03-29 00:04:16
技校到底有多乱?技校班主任普遍要求:班里男的不死、女的不生

技校到底有多乱?技校班主任普遍要求:班里男的不死、女的不生

莫将离
2024-03-14 20:14:09
场面完全失控!乌克兰第72机械化旅士兵哗变:打死少校和中尉军官

场面完全失控!乌克兰第72机械化旅士兵哗变:打死少校和中尉军官

奇思妙想草叶君
2024-03-27 21:33:57
闺蜜推荐我去按摩店上班的第一天,顾客让我加个钟

闺蜜推荐我去按摩店上班的第一天,顾客让我加个钟

温酒与茶
2024-03-22 09:55:32
彭加木神秘失踪是场国际“大骗局”?749局高人揭秘事件后的真相

彭加木神秘失踪是场国际“大骗局”?749局高人揭秘事件后的真相

真实异闻
2024-03-05 21:34:40
迅雷撤回了发给员工的小米汽车“优惠券”,“给大哥添乱了”

迅雷撤回了发给员工的小米汽车“优惠券”,“给大哥添乱了”

首席合规观察
2024-03-27 14:04:33
也门胡塞定性:没打击中国大陆船只,确定是8万吨英国黄埔号油轮

也门胡塞定性:没打击中国大陆船只,确定是8万吨英国黄埔号油轮

九微情感语录
2024-03-29 01:00:36
辽宁四川球迷又互骂了?辽篮为何到哪都挨骂:这个群体居功至伟

辽宁四川球迷又互骂了?辽篮为何到哪都挨骂:这个群体居功至伟

篮球快餐车
2024-03-29 01:25:29
仁爱礁大结局来了?中方给坐滩舰判“死刑”,美日欧声援菲律宾

仁爱礁大结局来了?中方给坐滩舰判“死刑”,美日欧声援菲律宾

星辰故事屋
2024-03-28 19:28:15
赛场直击|坚持到底 北控男篮客场憾负青岛国信水产队

赛场直击|坚持到底 北控男篮客场憾负青岛国信水产队

北京控股篮球俱乐部
2024-03-29 00:45:03
2024-03-29 06:12:49

科技要闻

李斌李想何小鹏喊你买小米汽车

头条要闻

小米汽车7分钟大定破2万 网友:这价格真可以杀穿同行

头条要闻

小米汽车7分钟大定破2万 网友:这价格真可以杀穿同行

体育要闻

找不到合适日期,龙赛罗:皇马可能要到8月初才会官宣姆巴佩

娱乐要闻

莱昂纳多与25岁新女友互相投喂超恩爱

财经要闻

中国版QE要来?国内外机构观点罕见一致

汽车要闻

混动增程双模式 长安UNI-Z售11.79万起

态度原创

亲子
教育
手机
公开课
军事航空

亲子要闻

网友:小孩姐让我坐一会儿吧

教育要闻

丰台首批拔尖创新人才培养基地校名单出炉!一文盘点北京7区基地校!

手机要闻

4299元,努比亚Z60 Ultra摄影师版开售丨超凡AI,大师影像

公开课

30岁之前,你要学会的13件事情

军事要闻

乌方声称击落两枚俄"锆石"高超音速导弹 俄方未予回应

无障碍浏览 进入关怀版
×