网易首页 > 网易科技 > 网易科技 > 正文

人机大战“辩论赛”:IBM的AI选手战胜人类辩论冠军

0
分享至

本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!

【网易智能讯 6月20日消息】日前,IBM 公司发布了被称为Project Debater的人工智能系统,这个系统与经验丰富的人类辩手之间举行了两场辩论,以展示它已经拥有的强大能力。

Debater在两次辩论中均获胜

Project Debater亮相在IBM位于旧金山办公室的包装舞台上,该系统内嵌有一个6英尺高的黑色面板,并带有一个蓝色动态“嘴巴”。这是人类辩论者Noa Ovadia和Dan Zafrir的最强大对手,它站在附近的领奖台后面。

几年来,IBM一直在公司内部进行人类与 Project Debater 之间的辩论,这次演示是首次公开辩论。虽然 Debater 在短时间内收集了大量支持其论点的证据,但是有时候的答辩会超出边际,偶尔也会表达错误。虽然机器在很多方面都表现地不太自然和磕绊,但这场史无前例的事件让人想起了计算机如何学习如何应对非结构化的人类决策世界,代表着对话式人工智能向前迈出了一步。

对于两次短暂的辩论,参与者必须准备一份四分钟的开幕词,然后是四分钟的反驳和两分钟论证总结。开幕辩论的主题是“我们应该资助太空探索”,其次是“我们应该扩大远程医疗的应用”。

Debater 的设计目的是分析单个辩论问题,然后扫描众多文档(从维基百科到杂志和新闻文章)中的数十亿个句子,以形成自己的论点、准备反驳对方观点的陈词以及总结陈词。

Debater 与人类对手分别有 4 分钟时间陈述自己的论点,4 分钟时间反驳对方的论点,2 分钟时间做总结陈词。与站在讲台后面的人类辩手不同,代表Debater 的是一个跟人一样高的黑色方尖碑,当显示 3 个圆点时就表示它在倾听或者准备论点。

该程序严格遵守辩论形式,概述论点,并通过从科学研究和全球事件中获取的事实来直接回应人类对手提出的论点。Debater 还一度比较准确地指出了对手所犯的事实错误。尽管这一举动在政治辩论中很常见,但是因为这是人工智能系统做出的应对,所以显得弥足珍贵。

在这两场辩论中,观众们都投票赞成票给Project Debater系统,其在传达的信息量方面表现更好。尽管AI系统出现了一些失误,但观众们在第二场辩论中投票认为AI系统在说服观众立场方面,比其人类对手Zafrir更具说服力。

机器以自信的节奏、有组织的结构发言,但缺乏语言精确度和议论清晰度。例如,在太空辩论期间,它几次重复了空间探索对经济有利的因素,使用的语言略有不同。在其他时候,AI系统以不自然的方式插入了随机语和引语。有一次,AI系统提到宇航员Scott Kelly,然后说“配音”,表明这部分论点是从视频记录中提取的。如果没有手势(好,完全没有双手)或面部表情,观众在听过机器人辩论者时仍然难以保持联系和交流。

AI的辩论能力经过六年研发

不过值得注意的是,有很多IBM员工可能一直在为他们的创作提供支持。IBM希望这项研究最终能够使一个更复杂的虚拟助理能够吸收大量不同的信息集合,以帮助建立有说服力的论点并作出明智的决定——不仅仅是回应简单的问题和命令。Project Debater是IBM处理非常大型数据集的能力的展示,其中包括几十个主题的数百万篇新闻文章,然后将论点片断变成流畅的文章——这是计算机的一项挑战性任务。

该公司已经花费了6年的时间来开发Project Debater的辩论能力,包括数据驱动的演讲能力,在演讲中识别关键声明的听力理解以及制定原则性论据的能力。它扩展了IBM超级计算机Watson的功能,公司正在使用它来挖掘庞大的内部数据集,包括帮助医生诊断不同类型的癌症。

近70年来,人工智能系统在一定程度上是通过学习西洋跳棋和国际象棋等游戏而发展起来的。1997年,IBM的深蓝程序在国际象棋中击败加里卡斯帕罗夫(Gary Kasparov );2011 年,IBM Watson 在《危险边缘》(Jeopardy)比赛中取胜。几年后,Google 的 Alpha Go 打败了顶级围棋冠军;一个名为Libratus的程序击败了全球四大顶级扑克玩家。而这次里程碑式的辩论发生在人与机器之间的多次相似的对决之后。

用语言和推理来辩论是一个更加复杂的游戏。“国际象棋的规则很少。即使对于更为复杂的围棋来说,我们仍然在谈论一个非常有限和明确界定的空间”。参加辩论的邓迪大学技术中心教授Chris Reed说。“对语言而言,它不是那么明确。”他说。“关于什么构成转折和游戏规则,灵活性更大。”

一旦人工智能具有说服力的论点,就可以将其用作辅助人类决策的工具。

IBM 负责AI的副总裁 Dario Gil 接受《财富》采访时表示,“这一计划的挑战在于脱离传统的游戏环境,尽管游戏可能很复杂,但你最终处在一个独立封闭的体系中。有一些规则需要遵守。将人工智能引入一个开放性问题领域非常有趣。问题是这能否实现?”

2012 年,Slonim 和其他研究人员开始开发 Debater,并在第二年 10 月得到了一个早期的工作原型。要取得成功,Debater 需要完成三项基本任务,每项任务都标志着人工智能领域的新突破,这包括:识别口语中的重要概念和观点;理解大量文档并提取明确的论点;以及模拟人类的困境和争议,来创建有原则的论点。

例如,Gil 表示,如果 Debater 正在准备一场赞成素食主义的辩论,它可能会从与该主题没有明确关联的内容中提取一个论点,比如一项科学研究表明动物可以感受到恐惧和其他情绪。人工智能系统还需要消除多余的词汇,并以对人类有说服力的方式提出其论点。

IBM 在 Debater 中的首要目标之一就是帮助人工智能系统掌握人类语言。诸如 Dragon 之类的语音听写程序只是被动地在文本和语音之间转录语言,而不进行分析。而诸如 Alexa 之类、受语音驱动的人工智能助手只能进行有限的交流,通常只会持续几秒钟。但 Debater 是要构建一个可能持续几分钟的论点,然后做出它的回应。

Gil 表示,IBM 计划适时将 Debater 投入商用。该技术可应用于从教育到法律、从政府到企业等多种领域。销售团队和辩护律师可以通过能够进行辩论的人工智能系统来巩固他们的观点,而研究人员和决策者可以从 Debater 产生的赞成和反对意见中受益。

Slonim 表示,另一种潜在的应用可能是,检查有多少证据(如果有)支持虚假主张,并揭示这些证据的可信度,借此来处理虚假新闻。他表示,“毫无疑问,我们正在开发的基础技术将对打击虚假新闻大有用处。”

Debater的未来:巨大的用途

除此之外,IBM 希望继续开发人工智能系统,推动 Project Debater 实现更加伟大的成就。

“IBM研究部门主管Arvind Krishna说:”我们相信人工智能具有很好的可以理解我们人类的巨大潜力。

其中一个例子可能是企业董事会决策,其中存在很多相互矛盾的观点。AI系统可以毫无情绪地倾听对话,将所有的证据和论据都考虑进去,并在必要时挑战人类的推理。“这可以提高以证据为基础的决策水平”。Reed说,他还补充,同样的系统可以用于反恐情报分析,例如确定某个人是否构成威胁。

在这两种情况下,机器都不会做出决定,但会有助于讨论,并作为另一位发言者。尽管辩论看起来像是一个噱头,但Reed认为这是对人工智能极限的重要证明。

“它有助于公众了解AI技术的最新状态,这意味着即将发生的机器人启示的恐慌可能会稍微缓和一些。”他说。

(选自:theguardian 编译:网易智能 参与:nariiy)

关注网易智能公众号(smartman163),为你解读AI领域大公司大事件,新观点新应用。

相关推荐
热点推荐
2024年,若房价继续下跌,国内41.5%的家庭,或将面临“4大困境”

2024年,若房价继续下跌,国内41.5%的家庭,或将面临“4大困境”

山丘楼评
2024-04-23 10:49:35
金靖宣布怀孕!与男友恋爱细节曝光,网友感慨:幸好不是李佳琦

金靖宣布怀孕!与男友恋爱细节曝光,网友感慨:幸好不是李佳琦

八点半克
2024-04-25 14:21:59
外交部确认布林肯将访华,措辞与去年明显不同,或为此访定下基调

外交部确认布林肯将访华,措辞与去年明显不同,或为此访定下基调

贺文萍
2024-04-25 18:30:03
韩国女团造型又惹争议,让未成年人穿透明裙子,一上台根本遮不住

韩国女团造型又惹争议,让未成年人穿透明裙子,一上台根本遮不住

萌神木木
2024-04-24 11:21:23
世界十大歌手排名

世界十大歌手排名

娱乐圈酸柠檬
2024-04-25 10:47:32
杨幂“吃戏”也翻车!吃口菜青筋暴起,半张脸都凹到变形了

杨幂“吃戏”也翻车!吃口菜青筋暴起,半张脸都凹到变形了

娱乐的小灶
2024-04-24 20:46:00
4月底人社部召开例会,养老金调整迎来好消息:有望上涨4%左右!

4月底人社部召开例会,养老金调整迎来好消息:有望上涨4%左右!

天下纵览
2024-04-25 10:22:11
探新丨2024款赛那全系官降2.5万,安全、舒适、智能全面升级

探新丨2024款赛那全系官降2.5万,安全、舒适、智能全面升级

车神探
2024-04-24 14:43:37
美国务卿布林肯访华,台湾问题摊牌

美国务卿布林肯访华,台湾问题摊牌

金羊网
2024-04-25 09:20:27
李鹏总理的6位家人:3位子女都是国家栋梁,如今都官至何位?

李鹏总理的6位家人:3位子女都是国家栋梁,如今都官至何位?

小啾咪侃侃史
2024-04-19 09:58:17
小S深夜发病!表白具俊晔“他的嘴唇好想吻”,网友惊呼好想吐。

小S深夜发病!表白具俊晔“他的嘴唇好想吻”,网友惊呼好想吐。

小毅讲历史
2024-04-24 20:19:20
美菲南海军演之际,马科斯录音曝光威胁对华开战,本人未出面澄清

美菲南海军演之际,马科斯录音曝光威胁对华开战,本人未出面澄清

陈菲副教授
2024-04-25 17:55:41
24046期双色球双枪定蓝法,终选两码,期待今晚继续定蓝成功

24046期双色球双枪定蓝法,终选两码,期待今晚继续定蓝成功

双色球的方向舵
2024-04-25 17:04:59
笑麻了!华人在法国开荒种地冲上热搜,评论区里全是内蒙古纪云浩

笑麻了!华人在法国开荒种地冲上热搜,评论区里全是内蒙古纪云浩

据说说娱乐
2024-04-24 22:15:31
北京今明气温升高, 明天傍晚到夜间山区有阵雨

北京今明气温升高, 明天傍晚到夜间山区有阵雨

北青网-北京青年报
2024-04-25 15:09:10
女医药代表自述:离职一年才敢和男朋友同房,至今仍抗拒去医院

女医药代表自述:离职一年才敢和男朋友同房,至今仍抗拒去医院

历史八卦社
2023-11-06 15:08:32
太阳4年2亿顶薪报价哈登 交易比尔先签后换 与杜兰特重聚升级控卫

太阳4年2亿顶薪报价哈登 交易比尔先签后换 与杜兰特重聚升级控卫

篮球话题团
2024-04-25 01:49:07
这一次,霸占车位车主低估了业主手段,教科书式反击让人拍手称赞

这一次,霸占车位车主低估了业主手段,教科书式反击让人拍手称赞

浩叔聊情感
2024-04-25 09:41:12
你碰到过哪些在某方面天赋极高的人?网友:那个小孩惊呆了众人

你碰到过哪些在某方面天赋极高的人?网友:那个小孩惊呆了众人

小鬼头体育
2024-03-31 23:48:52
裘德洛:曾帅到掉渣,如今52岁油到不能看,6个孩子只有女儿像他

裘德洛:曾帅到掉渣,如今52岁油到不能看,6个孩子只有女儿像他

娱乐白名单
2024-04-25 16:27:18
2024-04-25 19:20:50

科技要闻

北京车展,被穿红衣服的他们占领

头条要闻

俄副防长被抓:进国防部3年升副部长 系绍伊古"老搭档"

头条要闻

俄副防长被抓:进国防部3年升副部长 系绍伊古"老搭档"

体育要闻

当胜利变成意外,就不要再提未来……

娱乐要闻

心疼!伊能静曝儿子曾被狗仔追到洗手间

财经要闻

曙光已现?瑞银开始转而看好中国地产业

汽车要闻

全新哈弗H9亮相 大号方盒子硬派SUV入列

态度原创

教育
时尚
健康
艺术
本地

教育要闻

东莞一小学4年更换3款校服,家长敢怒不敢言,校方回应毫无说服力

我该怎么办?总是觉得渣男很有魅力!

这2种水果可降低高血压死亡风险

艺术要闻

艺术名画︱爱尔兰画家大卫·科因的刀画作品

本地新闻

云游中国|苗族蜡染:九黎城的“潮”文化

无障碍浏览 进入关怀版
×