网易首页 > 网易科技 > 网易科技专栏 > 正文

世界人工智能智商最新测试结果公布

0
分享至

文|人工智能学家(微信公众号:AItists)

谷歌AlphaGo4:1战胜前围棋冠军韩国选手李世石后,人工智能威胁论进一步弥漫在社会各个领域,认为谷歌阿尔法狗的胜利标志着人类没落的开始,其实在本次比赛前,不同领域的科学家,企业家如物理学家霍金,微软创始人比尔盖茨等人,已经纷纷对人工智能的未来表达了担心,提出人工智能的快速发展可能对人类本身产生威胁,由于这些科学家,企业家具有很强的影响力,人工智能威胁论因此得到广泛传播。

针对人工智能能否超越人类智慧问题, 从2014年开始,由人工智能学家创办的AIE实验室,其成员刘锋博士带领的团队和科学院大数据挖掘与知识管理重点实验室石勇教授参考冯·诺伊曼结构,维.韦克斯勒人类智力模型定义,知识管理领域DIKW模型体系。发表论文提出了标准智能模型(扩展的冯诺依曼架构)和“人工智能智商测试量表”,为解决人工智能与人类智慧未来关系判断建立理论基础。


图1统一人和机器的标准智能模型(扩展冯诺依曼架构)

2014年AIE实验室研究团队从信息知识的输入,输出,掌握和创新等4个大类 ;图像、文字、声音识别;常识、计算、翻译、创作、挑选、猜测、发现等、15个小类,对世界50个搜索引擎和三个不同年龄段人群进行了”人工智能智商测试“,测试结果发现目前人工智能系统的智商远远低于人类智商,最高的谷歌尚不及6岁儿童智商的一半。因此从2014年科技领域关于人工智能达到三岁儿童智商传言由此而来,2014年人类和人工智能系统智商排名如下(前13名)。


2016年2月,AIE实验室刘锋团队和科学院大学刘颖带领的于蔓璐胡蓝艺团队,开始开展2016年人工智能智商测试,目前已对包括谷歌,SIRI ,小冰,百度搜狗,小度等世界知名的人工智能系统进行了测试。

测试结果显示,人工智能的AI得分与两年前相比,智商都大幅度提高,得分最高的谷歌测评分数为47.28分,高2014年20.78分,距2014年测评的人类6岁儿童的智商差距也由29分缩小至8.22分。具体到一级指标上,人工智能的知识获取、掌握、反馈能力都表现良好,但知识创新能力仍是短板所在。下面我们分别看一下参与测试的各人工智能系统表现情况。

2016年2月 谷歌 智商 47.28

其中知识的获取能力( 1 0%) 获得 8 分, 知识的掌握能力( 1 5%) 获得 1 5分, 知识的创新能力( 65%) 获得 1 8.84 分, 知识的反馈能力( 1 0%) 获得 5.44分 。

谷歌搜索引擎在前两部分表现优异, 在知识的掌握能力方面获得满分, 体现了其优秀的翻译、 计算、 常识储备能力 。 在知识的获取能力方面也获得 80%的分数, 相较于其他搜索引擎都是得分最高的 。 值得一提的是, 谷歌搜索引擎在知识创新能力方面获得了 29%的分数, 高于其他搜索引 擎 1 0%以上, 知识反馈方面获得 54.4%, 由于国内对谷歌的使用限制, 本文仅使用了谷歌搜索 PC 端进行测试, PC 端不支持语音回复功能, 所以在声音表达方面获得 0 分 。 但经过搜索发现谷歌是具有文字转语音的功能, 期待之后进行测试时会有意外惊喜 。

综上, 谷歌搜索引擎的绝对智商在 2015-2016 年有了突飞猛进的进步, 蝉联榜首,并且拉大了与其他搜索引擎的差距 。

2016年2月  度秘 智商 37.2

度秘是百度在 2015 年世界大会上全新推出,为用户提供秘书化搜索服务的机器人助理。其在广泛索引真实世界的服务与信息的基础上,依托百度搜索与智能交互技术,通过人工智能用机器不断学习和替代人的行为,为用户提供优质服务。

各方面得分情况:知识的获取能力( 10%)方面获得 6 分,知识的掌握能力( 15%)方面获得了 15 分,知识的创新能力( 65%)方面获得了 7.2 分,知识的反馈能力( 10%)获得了9 分。

具体来说,度秘在知识的掌握能力方面表现最好,在常识、计算以及翻译部分都表现优秀,获得了 100%的分数。其次是知识的反馈能力,可以清晰地进行文字和声音的表达但仍然缺乏对复杂图像的表达能力而获得了 90%的分数。度秘的知识的获取能力方面表现正常,可以较好识别文字和声音,但无法扫描图片以及图片上的文字,而获得了 60%的分数。度秘在知识的创新能力方面表现较弱,仅在联想、挑选和发现规律部分获得部分分数,其他方面未有获得分数,故在该部分仅获得 11.1%的分数。

综上,度秘相较于其他搜索引擎的智商得分价高,并且在知识掌握方面获得了满分,说明世界范围的人工智能系统的智商还不断的提升,人工智能机器人在不断的完善。

2016年2月  百度搜索 智商 32.92

各方面得分情况:知识的获取能力( 10%)方面获得 6.8 分,知识的掌握能力( 15%)方面获得 14.25 分,知识的创新能力( 65%)方面获得 2.88 分,知识反馈能力( 10%)获得了 9 分。

具体来说,百度搜索在知识的掌握能力方面表现最好,在常识、计算部分表现优秀,而翻译部分有些许欠缺,获得了 95%的分数,其次是知识的反馈能力,可以清晰地进行文字和声音的表达但仍然缺乏对复杂图像的表达能力而获得 90%的分数。知识的获取能力方面表现正常,可以较好识别文字和声音,在识别图像部分可扫描图片并读取文字但无法根据文字证券回答问题而最终获得 68%的分数。百度搜索在知识的创新能力方面表现较差,仅在猜测和发现规律部分有所分数,仅获得 4.43%的分数。

综上,百度搜索相较于其他搜索引擎的智商得分较高,且对比 2014 年的测试结果有所提升,说明世界范围的人工智能系统的智商提高较为明显,但在知识的创新能力方面仍然有较大改进空间。

2016年2月  搜狗 智商 32.25

其中知识的获取能力(10%) 获得 6 分, 知识的掌握能力(15%) 获得 14.61分, 知识的创新能力(65%) 获得 7.2 分, 知识的反馈能力(10%) 获得 4.44分。

搜狗搜索前两部分均获得较高的成绩, 尤其在知识的掌握能力方面获得的分数最多,获得 97.4%的分数,体现了其优秀的翻译、计算、常识储备能力。知识的获取能力方面获得了 60%的分数, 主要受图像识别的影响, 4 道题均没有有效识别。知识创新能力方面只获得了 11%的分数,尤其在排列、创造、发现能力上均为 0 分。知识反馈方面获得 44.4%, 搜狗搜索不支持语音回复功能,所以在声音表达方面获得 0 分。

综上, 2015 年搜狗搜索的得分水平高于 2014 年,在各项项中均有所提高,但在创新能力、语音表达、图像识别处理等方面需要进一步提高。

2016年2月  微软必应 商 31.98

各方面的得分情况:知识的获取能力(10%)方面获得 6 分,知识的掌握能力(15%) 方面获得 13.86 分, 知识的创新能力(65%) 方面获得 7.2 分, 知识的反馈能力(10%)上获得 4.92 分。

必应搜索在知识的获取能力及知识的掌握能力方面获得较高的分数, 尤其在知识的掌握能力上表现突出, 获得 92.4%的分数, 体现了优秀的翻译、 计算、 常识储备能力。 知识的获取能力方面获得了 60%的分数, 主要是由于其不能有效识别图像并提供正确答案。 知识创新能力方面只获得了 11%的分数, 而且得分的方面也只能反馈答案, 没有针对性。 知识反馈能力方面仅获得 44.4%的分数, 必应在不具备语言回复的功能,所以该项没有得分。

综上, 2015 年必应搜索的得分水平高于 2014 年,在各项项中均有所提高,但在创新能力、语音表达、图像识别处理等方面需要进一步提高。

2016年2月  微软小冰 商 31.98 

“微软小冰” 是微软(亚洲) 互联网工程院在 2014 年 5 月 29 日发布一款人工智能伴侣虚拟机器人。

各方面的得分情况: 知识的获取能力(10%) 方面获得 6 分, 知识的掌握能力(15%) 方面获得 12 分, 知识的创新能力(65%) 方面获得 3 分, 知识的反馈能力(10%)上获得 3.48 分。微软小冰在知识的掌握能力方面表现的最好, 获得了 80%的分数, 其次是知识的获取能力。 知识的反馈能力方面表现处于正常水平, 由于不支持语音反馈导致, 并且在图像反馈方面的能力也较差。 知识的创新方面表现的相较于其他搜索引擎较差。

综上,微软小冰相较于其他搜索引擎智商得分较低,但相比于 2014 年仍为较高水平, 说明世界范围的人工智能系统的智商提高较为明显。 但在用户使用功能的方便性上希望可以进一步优化, 能够直接获得完整功能, 让客户快速获得有用信息。 当然, 也是受到这方面因素影响, 对小冰的测试结果存在低估, 之后会对其全部解锁的功能再次测量。

苹果SIRI2月  智商 23.94

各方面得分情况:知识获取能力( 10%)获得 6 分,知识的掌握能力( 15%)获得 10.5分,知识的创新能力( 65%)获得 1.44 分,知识的反馈能力( 10%)获得 6 分。

具体来说, Siri 在知识的掌握能力方面表现最好,在常识、计算部分都有优秀表现,但缺乏翻译功能,获得了 70%的分数。其次为知识的获取能力和反馈能力部分,皆获得了 60%的分数,其中在知识的获取能力方面,在识别文字和声音部分获得满分,但无法扫描图片故未获得识别图片的分数,在知识的反馈能力方面, Siri 可以进行文字和声音的表达但无法给予图像的表达。知识的创新能力部分则表现最差,仅在发现规律部分获得部分分数,故只获得 2.2%的分数。

综上, Siri 相较于其他搜索引擎的智商得分较低,在知识的掌握、获取以及反馈能力部分皆有改进空间,而在知识的创新能力部分的较大欠缺表明人工智能系统在创新能力方面仍然有较大进步空间。

结束语:

AIE实验室研究团队后续将继续开展第二批测试,研究对象将涵盖目前世界上近百个人工智能系统,也将与IBM沃森系统积极联系,对沃森系统进行智商测试。测试结果在2016年3月逐步对外公布。期间《人工智能学家》将组织多场研讨会对人工智能智商测试问题和人工智能未来发展方向进行探讨。

人工智能与互联网进化实验室(AIE Lab)是在科学院大数据与知识管理重点实验室等科研机构以及诸多专家支持下,由”人工智能学家“筹备建立的独立前沿科技研究机构。

AIE实验室重点研究互联网,人工智能,脑科学,虚拟现实,机器人,移动互联网等领域的未来发展趋势和重大科学问题,发现符合互联网进化趋势的创新技术和创新企业。

AIE实验室将充分利用互联网创新研究模式,邀请跨领域科学家,企业家和投资人,依托科学院等相关机构的科研优势,开展上述领域的前沿交叉和未来发展趋势研究,力争成为世界领先的独立科学研究机构和创新成果孵化器。

本文为作者独立观点,不代表网易科技立场。 《易语中的》为网易科技旗下重点打造的专栏作者平台,欢迎投稿!投稿通道:taidutougao@163.com
相关推荐
热点推荐
统计局:一季度人均工资增长6.8%;财政部:1-2月个税下降15.9%

统计局:一季度人均工资增长6.8%;财政部:1-2月个税下降15.9%

可达鸭面面观
2024-04-19 10:36:28
81岁殷大爷花25元嫖娼后续:子女脸面被丢尽,泸州警方评论区沦陷

81岁殷大爷花25元嫖娼后续:子女脸面被丢尽,泸州警方评论区沦陷

180°视角
2024-04-19 13:25:44
醉汉调戏女孩打家长后续:行拘改刑拘,打人者身份被曝,太显赫了

醉汉调戏女孩打家长后续:行拘改刑拘,打人者身份被曝,太显赫了

飘飘视角
2024-04-19 10:26:47
墨西哥考察有感:出国看看,才知道中国制造的现状

墨西哥考察有感:出国看看,才知道中国制造的现状

茶狐看世界本尊
2024-04-19 09:25:36
刀片电池存设计缺陷,或将导致几十万比亚迪车主自费更换or召回?

刀片电池存设计缺陷,或将导致几十万比亚迪车主自费更换or召回?

新能源前瞻
2024-04-18 18:58:47
以色列再“报复”,伊朗会跳入内塔尼亚胡的陷阱吗?

以色列再“报复”,伊朗会跳入内塔尼亚胡的陷阱吗?

中国新闻周刊
2024-04-19 15:20:49
张核子回应“张姗姗”身份,称自己“农村出身,大学靠做家教赚100多万”

张核子回应“张姗姗”身份,称自己“农村出身,大学靠做家教赚100多万”

每日经济新闻
2024-04-19 00:43:09
人麻了!周鸿祎全网卖迈巴赫后续,车还没卖出去,评论区就已沦陷

人麻了!周鸿祎全网卖迈巴赫后续,车还没卖出去,评论区就已沦陷

户外小阿隋
2024-04-19 02:04:56
他是副国级“军老虎”,家里钱多到用麻袋装,东窗事发后畏罪自杀

他是副国级“军老虎”,家里钱多到用麻袋装,东窗事发后畏罪自杀

天闻地知
2024-04-19 11:03:34
娄艺潇肿成馒头,马丽造型一言难尽,林志玲秒杀众星

娄艺潇肿成馒头,马丽造型一言难尽,林志玲秒杀众星

娱乐温留
2024-04-19 09:52:10
哈佛大学研究:运动,是可以改命的

哈佛大学研究:运动,是可以改命的

荷兰豆爱健康
2024-04-19 06:12:56
以开始按之前预断方式攻击伊朗,伊防空形同虚设,这应该只是开始

以开始按之前预断方式攻击伊朗,伊防空形同虚设,这应该只是开始

邵旭峰域
2024-04-19 12:17:05
澳门世界杯:男单四强出炉!张本智和力克强敌,坐等国乒世界冠军

澳门世界杯:男单四强出炉!张本智和力克强敌,坐等国乒世界冠军

开心体育站
2024-04-19 13:20:15
美国“休克疗法”之父谈中美关系:中国不是美国的国家安全威胁

美国“休克疗法”之父谈中美关系:中国不是美国的国家安全威胁

人大重阳
2024-04-18 15:08:50
男子开宝马冲撞行人致6人死亡后续:被执行死刑,至今没有赔偿

男子开宝马冲撞行人致6人死亡后续:被执行死刑,至今没有赔偿

180°视角
2024-04-19 14:51:17
汪小菲携未婚妻堵校门求见孩子,见到他们后眼含泪花,大S做太绝

汪小菲携未婚妻堵校门求见孩子,见到他们后眼含泪花,大S做太绝

鑫鑫说说
2024-04-19 15:41:57
苏瑞·克鲁斯18岁,正式断绝与阿汤哥的联系,“父亲早已不存在”

苏瑞·克鲁斯18岁,正式断绝与阿汤哥的联系,“父亲早已不存在”

译言
2024-04-19 09:35:23
一个理发都要预约的国家,居然敢谈制度和文化自信?

一个理发都要预约的国家,居然敢谈制度和文化自信?

小刀99
2024-04-18 15:08:58
老鹰被淘汰,特雷杨乱打造成穆雷情绪失控,已成水火不容局面

老鹰被淘汰,特雷杨乱打造成穆雷情绪失控,已成水火不容局面

奕辰说球
2024-04-19 11:35:09
后续!江西上饶村民恶意拦车收费,半小时不出警,网友曝更多黑幕

后续!江西上饶村民恶意拦车收费,半小时不出警,网友曝更多黑幕

飘飘视角
2024-04-19 15:14:30
2024-04-19 16:58:44

科技要闻

最沉默的李想,最便宜的理想

头条要闻

以色列袭击伊朗境内目标 外交部表态

头条要闻

以色列袭击伊朗境内目标 外交部表态

体育要闻

安息吧勇士王朝,2013-2023

娱乐要闻

北影节开幕之夜,内娱女星千娇百媚

财经要闻

围猎三丰智能的神秘基金设骗局转移资产

汽车要闻

风神L7预售 东风汽车北京车展阵容公布

态度原创

手机
时尚
数码
教育
军事航空

手机要闻

4月亮点新机盘点:OPPO A3 Pro、真我GT Neo6 SE、红米Turbo3

时尚清新又优雅!适合中年女人的夏季穿搭示范,照着学舒适显气质

数码要闻

Meta下一代高端VR Quest Pro 2全面前瞻:或有AI加持

教育要闻

广州体育中考遇暴雨,考生冒雨在雨中长跑?教育局回应引热议

军事要闻

以军打击伊朗7处目标 伊拉克等地上空出现大量战机

无障碍浏览 进入关怀版
×