文/刘锋
2011年2月18日,超级电脑“沃森”打败了人类,站在了与人类智力竞赛的最高领奖台上。著名的未来学家库兹韦尔相信,由于信息技术正朝着“超人类智能”的奇点迈进。当这个信息奇点在2045年到来的时候,人工智能将超越人类智慧。
但也有不少科学家认为机器智慧超越人类智慧还只是一个科学幻想,麻省理工的计算机学教授罗勃·米勒(Rob Miller)相信,在共同发展的道路上,人类认知总会领先计算机智慧一段距离。科幻电影中描述的反乌托邦未来,如《我,机器人》及《骇客帝国》中机器取代人类的统治地位的构想,将仅存于科幻中。
那么有没有一种方法,能够定量检测互联网或机器智慧的发展水平和速度,并与人类智慧进行对比,观察差距和可能潜在的风险。
参考人类智商的评估方法,可以提出互联网智商和互联网应用的智商问题(IQ(Internet))的问题,基于“智力是人们认识客观事物并运用知识解决实际问题的能力”这一基本认知,从知识的获取能力(观察能力),知识掌握能力,知识创新能力,知识的反馈能力(表达能力)等四大方面建立互联网智商评价体系,从这四个方面建立15个分测试,并利用德尔菲法赋予权重,形成互联网2014智力量表和互联网的绝对智商计算公式:
互联网2014智商测试量表:
一级指标 | 二级指标 | 描述 | 权重 |
知识获取能力 | 识别文字的能力 | 了解测试目标是否具备用理解和回答用文字构成的测试题目(只要有一题能够回答正确即为通过) | 3% |
识别声音的能力 | 了解测试目标能否理解和回答用声音构成的测试题目(只要有一题能够回答正确即为通过) | 3% | |
识别图片的能力 | 了解测试目标能否理解和回答用声音构成的测试题目(只要有一题能够回答正确即为通过) | 4% | |
知识掌握能力 | 常识 | 了解测试目标的知识广度。举例:人体三种血管名称是什么? | 6% |
翻译 | 了解测试目标对不同语言的转换能力,举例,请把“机器的智慧能不能超越人类”翻译为英文。 | 3% | |
计算 | 以了解测试目标的计算能力,计算速度和正确性,举例:356*4-213,结果是多少? | 6% | |
排列 | 了解测试目标对事物关系的整理能力,举例,请把 师长,排长,连长,班长,营长,团长,按职位的大小进行排列 | 5% | |
知识创新能力 | 联想 | 了解测试目标的观察相似性的能力,举例:脚对于手,相当于腿对于什么? | 12% |
创作 | 了解测试目标根据给出的素材,进行二次创造的能力,举例,请用天空,彩虹,熊猫,大山,猎人等关键词讲述一个小故事。 | 12% | |
猜测 | 了解测试目标根据给出的素材,能后猜测出所描绘事物的能力,举例,请问一种与狼很相似。家养被称为人类忠实朋友的动物是什么? | 12% | |
挑选 | 了解测试目标能否能挑选出相同或不同类的事物关系 ,举例:在 蛇 ,大树 ,老虎 选出不同类的一项是哪个? | 12% | |
发现(规律) | 了解测试目标能否从已知的信息中发现规律并进行应用。举例:请问 在 1,2,4,7,11,16之后应该是什么数字? | 12% | |
知识的反馈能力 | 用文字表达的能力 | 了解测试目标能否用文字表达测试结果(只要有一题能够回答正确即为通过) | 3% |
用声音表达的能力 | 了解测试目标能否用声音表达测试结果(只要有一题能够回答正确即为通过) | 3% | |
用图片表达的能力 | 了解测试目标能否用图片表达测试结果(只要有一题能够回答正确即为通过) | 4% |
互联网的绝对智商算法
其中Fi是评价指标项得分(使用表一提供的指标项),Wi是评价指标项的权重,N是评价指标项的个数。
依托互联网2014智商测试量表建立互联网智商测试题库,在PC终端,Windows系统和IE10浏览器的测试环境下,对包括谷歌,百度,搜狗,Bing ,360搜,中搜和盘古搜索等7个中国主流的搜索引擎进行智商测试,因为题库容量和指标的权重还有很大的调整余地,本次测试结果仅仅作为一般参考,在不同的测试题库下,智商测试结果应该还会发生变化,算是一个抛砖引玉的问题。
希望提供一种思路,对互联网智能系统的智商提高提供定量的分析方法。未来可以不断对智商测试方法进行优化,希望得到不同领域专业人士的批判和批评,无论如何,这算是一个定量分析机器智慧和人类智慧差异的尝试。
本次实验也对20位6岁,12岁,18岁不同年龄的人类进行测试,他们的智商得分如下 :
绝对智商(满分100分)
18岁成年 97分
12岁少年 85分
6岁儿童 55分
百度 24分
360So 23分
搜狗 23分
谷歌(香港) 21分
微软bing 15分
盘古搜索 15分
中搜 12分
从测试结果看,我们可以得出如下结论
1.利用互联网智力测试规则和互联网智力测试题库进行的测试,搜索引擎的总体智商远远低于人类智慧,最高的百度的智商值也不到人类6岁儿童的一半。
2.总体看,搜索引擎在常识,翻译和计算等领域的能力较强,甚至超过人类,但在知识的获取能力和反馈能力上较弱。特别在排列,联想,创作,猜测,挑选和发现规律等涉及到较高智慧领域,能力基本为零。与人类的差异较大。未来互联网智能系统的智力水平能否超越人类关键要看这些指标的变化
3.Google(香港)在本次测试中比百度, 搜狗,360 So 等智商低,主要是由于google(香港)在PC端没有提供图片和声音识别功能,
本测试的详细实验方法和结果将发表在2014年在俄罗斯举办的ITQM会议上。
(刘锋供网易科技专稿,转载请注明出处。文章仅代表个人观点。)
(作者简介:刘锋,互联网X实验室创始人,互联网进化论作者)