网易首页 > 网易科技 > 智能硬件 > 正文

李飞飞:人工智能技术正面临寒武纪般的大爆发

0
分享至

点击查看直播

网易科技讯1月15日消息,未来论坛2017年会暨首届未来科学大奖颁奖典礼在北京举行。斯坦福大学计算机系终身教授、人工智能实验室主任、谷歌云首席科学家李飞飞在论坛上发表了主旨演讲,在演讲中,她透露目前她的团队已经人工智能的视觉识别取得了更多的进步,已经可以识别视频。她认为人工智能正面临寒武纪般的大爆发,希望有更多样化背景的人加入人工智能的研究。

人工智能在视觉识别上取得了很大的突破,但是教电脑识别物品只是第一步。之后是,要教电脑看懂图片,并且用一句话来描述它,我们需要用到神经系统,并且把神经系统推向一个高度,我们需要把视觉信息和文本信息结合起来,并且让它生成出一个具有意义的句子。目前,李飞飞团队已经在这里领域取得了突破。

同时,他们已经在与一些公司进行合作。

她谈到:“最近我们和Facebook进行了合作,当然我们也和谷歌合作,我们进一步扩展了我们工作的范围,不仅仅能够让机器识别出运动的类型,而且可以看看单个队员做了哪些事情,我们来看NBA的篮球,机器可以追踪每个队员在重要事件中(的表现),譬如三分球,罚球,可以看到队员在其中的表现,我们拿了一些医院的安检视频,通过深度传感器的视频来进行分析应用,通过这样可以识别出人类的运动,看看他们在环境下的行为是安全的还是危险的。”

“我们和欧洲一个火车站进行了合作,将成百上千个传感器安装在公共空间,利用这些计算机的传感器来追踪乘客的行动,有非常多的乘客每天、每周、每年在火车站穿梭,通过这样一种监测可以帮助优化火车站的空间,调整火车发车时段。”她同时举例。

此外,她透露:“最近我们利用了深度学习和卷积神经网络让机器学习如何预测人类行为的轨迹,这样一个工作能够把我们前边所讨论的结合在一起,算法不仅有IQ,可以识别出人,而且它也有EQ,有情商,它可以预测人的行为,譬如说机器人的行为,‘机器人不应该干扰人的行为’,或者是机器人在空间行走时不能打破东西。”同时,其他的一些尝试也在进行。比如和斯坦福医院合作,部署相关技术,可以提高他们工作流程的绩效。在有老人的家庭中对他们进行监测。

她提到,在5亿年的进化当中,视觉已经成了人类最重要的感知系统,人类大脑其中有一半的功能都是和视觉系统联系在一起的。在5亿年前大爆炸式的增长,现在如果我们能够让更多的人参与到AI教育和研究当中,我们可以鼓励更多技术多样化的发展,这样我们会看到人工智能取得像在寒武纪一样的技术上的大爆炸,会使我们的世界变得更好。(温泉)

以下为演讲速记:

李飞飞:大家下午好!在这里我非常荣幸,尤其是在这个历史性时刻,中国正在庆祝它在科学和创新领域的进步。今天我来到这边是作为人工智能的小组成员,我想跟大家分享一下视觉技术方面最新的进展。

大概5亿年前,我们有一些非常简单的生物生活在一片非常大的海洋当中,它们等待着食物的到来,或者成为别人的食物。动物的世界在当时非常简单,只有一些简单的物种生活在地球上,后来可能是出于偶然,在广袤的海洋中出现了更加丰富的物种,这些动物其实还是非常简单,它们就像我们最初非常简单的照相机一样,功能设置都是非常简单的,只有在视觉发展之后动物才变得更加积极,尤其是在猎取食物时,它们可以自发进攻,它们也会寻找更隐蔽的地方躲藏起来,避免自己成为它人的食物。

慢慢地,在一段时间内,我们的物种得到了非常丰富的发展,这也是视觉发展的一个结果,这时是寒武纪大爆发。寒武纪大爆发之后,视觉就在动物中发挥着非常重要的作用,帮助它们寻找食物、帮助它们躲避敌人。作为人,我们也是一样的,我们也用视觉支持我们的生活、我们的工作、我们的交流,让我们更好地了解世界。

事实上,在5亿年的进化当中,视觉已经成了我们人最重要的感知系统,我们的大脑其中有一半的功能都是和视觉系统联系在一起的。对于动物来说,它们也看到了世界的光明,大概在5.3亿年之前,那时没有电脑、没有机器,还是黑暗一片,我们也没有监控器,目前每一秒我们都有成百上千万的视频上传到电脑中,根据内容把所有视频划分成不同的类别,现在无人机也可以飞翔在天空中,但我们还是没有一台非常好的摄像机能够跟踪拍摄无人机工作的全过程,我们最智能的机器目前还没有得到突破。

作为电脑视觉的科学家,我们希望电脑视觉能够为数字世界带来曙光,能够让我们的视频、让我们的图片更加光彩照人。

为了实现这样一个目标,首先我们要教电脑识别物品,最简单的办法,我们可以想像一下,这个教学过程是这样的:我们可以培训我们的电脑,比如说我们可以把一只猫放到电脑中去,让它识别,然后我们会建立一些数学模型,人可以为猫写出一组公式来,让电脑识别它,这就是我们最初做的尝试。

我们想要把一个物品的不同部分分离出来,然后用非常简单的几何模型,数字模型,模拟模型,让电脑更好识别出放在它面前的是什么样的东西。

这只猫呢?这只猫不一样啊,所以现在我们是不是要重新设计一个模型,让电脑能够识别出不同姿势的猫?但我们还有很多不同种类的猫呀,为了让不同的猫都能被计算机识别出来,我们需要设计不同的模型,这就让我们感到很烦,我们觉得需要制造出无数的模型。所以很多年来我们都想找到一个非常神奇的数字模型,它能够满足不同的猫的变形体。

八年前我的思维得到了非常大的改变,那就是从小孩学习的过程中得到了灵感,因为我们并没有告诉一个孩子你要怎样认出一只猫,我们没告诉他猫是这个样子,耳朵是这样、眼睛是这样,我们只是给他看一张照片或是一只真实的猫,他就会记住,我们不需要把世界上成百上千的猫的照片都给小孩看,之后他才能学会怎样识别一只猫,不需要那么复杂。

在孩子成长发育的过程中他们其实有非常神奇的一项功能,所以我们就想说,我们应该学习小孩是怎样了解、识别物体的,我们花了很多时间来做这项研究。

我和普林斯顿的同事家政、李凯一起在网络上找到了很多图片、很多数据,这些图片都是大家上传到网络上,我们用了成百上千的图片构建这套系统。在八年的辛勤研究后,2009年我们终于做出了这样一个体系,其中包括1500万张图片和22000个不同的单词门类,都是我们日常见到的,这从数量和质量来说都是史无前例的,尤其在机器学习和视觉方面前所未有。

这是从小孩的视角看到的世界,所以学习可以从大数据中获益,这是我们从小孩的视角得到的灵感。

通过图片网络提供给我们的数据是非常庞大的,这些东西都会进入到我们的中枢神经系统,最终进入到电脑的中央处理器当中,我们的中枢神经系统其实和我们的大脑是非常相似的,我们可以给它作出类似神经元的单位。另外,就像我们的大脑一样,我们有成百上千个“类神经元”单位互相连接在一起,这是一个非常经典的放在电脑上的中枢神经系统,它大概有2400万个节点,1.4亿个参数和150亿个接口。

拥有这么庞大的信息,我们现在的电脑都需要去处理这些数据,这样一个公式让我们的视觉识别技术得到了极大的发展,也给我们带来了一些非常振奋人心的结果,电脑告诉我们这张照片里有一只猫,这个猫在那里;这边是计算机告诉我们,小孩拿着他的泰迪熊。我们看到的物体都比较小,但电脑还是能够识别出来。截止到目前,我们都一直专注于教电脑怎样识别物体,就像小孩学最简单的单词一样,这只是第一步,小孩很快会进入下一阶段的发展,那就是用句子交流。

所以不仅仅要看图片、不仅仅要标注出来这是一只猫,15岁的人还会告诉我们如下信息:

这是另外一个例子。

所以要教电脑看懂图片,并且用一句话来描述它,我们其实需要用到神经系统,并且把神经系统推向一个高度,我们需要把视觉信息和文本信息结合起来,并且让它生成出一个具有意义的句子。

又经过一个阶段的努力研究,大概是一年多时间,也和其它实验室进行了合作,我们是第一批发现了深度机器学习奥秘的科学家,这就是电脑能够告诉我们的一些信息。

(电脑说话)

当然,相比三岁的孩子,电脑没有那么可爱。所以这是另外一个例子。

之后我们把图片获取的能力和视觉识别结合起来,在抓取图片的过程当中我们发现电脑其实可以生成很多句不同的话,能够提供给我们更多信息,这边就是一个例子,这是我们最近的一项工作,大概是一年半之前出版发表的,电脑能够在一幅画中整理出非常多的句子,我们也在近期提交了另外一篇论文,这篇论文中提到,机器(也就是电脑)能够用它的公式、用它的计算方法生成出完整的自然段,得到大脑的启发之后,我们发现深度学习的算法和公式能够帮助我们做一些视觉方面的检测,这是从人脑的视角来看。

在中枢神经和深度学习技术得到如此大的发展之后,我们也开始把焦点转向其它一些领域,比如视频,我们在图片中学习到的东西能否复制到视频中去,能否让真实世界从中获益,我的实验室和谷歌的团队合作,把YouTube上运动相关的视频都抓取出来,它们分别属于不同的运动类别,我们希望有一天这样的技术能够帮助我们去管理、索引和搜索大量的视频和图片,能够在一个大数据的库存中进行图片和视频的搜索,在这里大家能看到计算机激动对屏幕上的体育(项目)进行分类,这里包括各种各样的体育项目,武术、篮球,还有帆船运动等等。

最近我们和Facebook进行了合作,当然我们也和谷歌合作,我们进一步扩展了我们工作的范围,不仅仅能够让机器识别出运动的类型,而且可以看看单个队员做了哪些事情,我们来看NBA的篮球,机器可以追踪每个队员在重要事件中(的表现),譬如三分球,罚球,可以看到队员在其中的表现,我们拿了一些医院的安检视频,通过深度传感器的视频来进行分析应用,通过这样可以识别出人类的运动,看看他们在环境下的行为是安全的还是危险的。

我们和欧洲一个火车站进行了合作,将成百上千个传感器安装在公共空间,利用这些计算机的传感器来追踪乘客的行动,有非常多的乘客每天、每周、每年在火车站穿梭,通过这样一种监测可以帮助优化火车站的空间,调整火车发车时段。

最近我们利用了深度学习和卷积神经网络让机器学习如何预测人类行为的轨迹,这样一个工作能够把我们前边所讨论的结合在一起,算法不仅有IQ,可以识别出人,而且它也有EQ,有情商,它可以预测人的行为,譬如说机器人的行为,“机器人不应该干扰人的行为”,或者是机器人在空间行走时不能打破东西。

我们利用所有这些技术和现实中的情况进行合作,现在我们和斯坦福医院合作,部署相关技术,可以提高他们工作流程的绩效。洗手的习惯,在老人的家庭中也可以对他们进行监测。

从技术人士的视角看到计算机视觉算法的发展,真的让我感到特别兴奋,它能够帮助我们解决现实世界的问题,这是一个技术人士的视角。

大概是5亿年前,动物和视觉面临的挑战是要使各个组织能够存活,而现在机器和AI所面临的挑战就是让人类能够繁荣,永远持续下去,作为技术人员我们要问,AI是否会成为一种摧毁力?还是能给我们带来更好的世界?我一直在思考这个问题,已经思考很久了,最近我突然顿悟,AI的世界是位于那些创造、开发和使用AI的人的手中,人工智能AI会改变世界,但这里真正的问题是谁会改变AI。

大家都知道,世界各地都是缺乏多样性的,包括美国的硅谷,中国、欧洲,还有很多其它区域都缺乏多样性,在美国学术界只有25%的计算机专业人士是女性,不到15%的美国领先工程学校的教职员工是女性,对于少数族裔来说,女性的代表就更少了,这里不仅涉及到工作场所文化的问题,实际上这个问题也是经济的问题。

几个月前我受邀美国白宫讨论了在AI中多样性的必要性,我指出有三个理由使我们必须要提高AI的多样性,这个就是涉及到经济和劳动力的原因,AI人工智能是一个日益增长的技术,会影响到每个人,我们需要更多人能开发出更好的技术;第二个原因是涉及到创造力和创新,很多研究都显示出,当拥有多种多样背景的人共同合作时,会产生更好的结果,会找到更具有创意的解决方案;最后也是涉及到社会正义和道德价值的,当各种各样背景的人聚集到一起时,他们有着各种各样不同的价值观,代表着人类的技术也会有更加多样性的思考。

视觉和智能的发展造成了动物品种多样性在5亿年前大爆炸式的增长,现在如果我们能够让更多的人参与到AI教育和研究当中,我们可以鼓励更多技术多样化的发展,这样我们会看到寒武纪技术上的大爆炸,会使我们的世界变得更好。

这是一位教育家和一位母亲的视角。

谢谢各位!

相关推荐
热点推荐
被蔡斌要求体测,朱婷摊牌发声,官宣决定,赖亚文遗憾,郎平支持

被蔡斌要求体测,朱婷摊牌发声,官宣决定,赖亚文遗憾,郎平支持

东球弟
2024-05-01 11:27:39
5月1日,杨颖突然冲上了热搜,只因为有网友在云南偶遇了杨颖

5月1日,杨颖突然冲上了热搜,只因为有网友在云南偶遇了杨颖

穷游天下的阿等
2024-05-01 21:24:42
媒体人:恩里克拿球能力是中乙级别,抢点攻门是比埃尔霍夫级别

媒体人:恩里克拿球能力是中乙级别,抢点攻门是比埃尔霍夫级别

直播吧
2024-05-01 21:40:48
倒计时90天,松弛的法国人被逼疯:我在办奥运还是时装周?

倒计时90天,松弛的法国人被逼疯:我在办奥运还是时装周?

InsDaily
2024-04-30 11:51:07
梅大高速事故已有500多人参与救援,一亲历者发声:车轮刮到地面裂缝爆胎,万幸在塌陷前冲过

梅大高速事故已有500多人参与救援,一亲历者发声:车轮刮到地面裂缝爆胎,万幸在塌陷前冲过

极目新闻
2024-05-01 14:15:08
真敢说!曝郑怡静再次抨击莎粉:不想沙特对决孙颖莎,宁愿退赛

真敢说!曝郑怡静再次抨击莎粉:不想沙特对决孙颖莎,宁愿退赛

娱乐的小灶
2024-05-01 23:28:51
女人在过夫妻性生活时,为什么总发出声音?医生:大多数人不了解

女人在过夫妻性生活时,为什么总发出声音?医生:大多数人不了解

皮皮讲文
2024-01-02 10:36:17
王石再次预测中国房地产未来走向!前两次都准!这次可能又是对的

王石再次预测中国房地产未来走向!前两次都准!这次可能又是对的

刺头体育
2024-05-01 20:07:52
34岁鹿晗自曝不吃碳水很多年!脸部肿胀已过气,被嘲配不上关晓彤

34岁鹿晗自曝不吃碳水很多年!脸部肿胀已过气,被嘲配不上关晓彤

小咪侃娱圈
2024-05-01 11:35:17
美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

慎独赢
2024-05-01 11:10:03
恭喜马斯克,成为“入党积极分子”!

恭喜马斯克,成为“入党积极分子”!

燕梳楼2021
2024-05-01 10:27:37
申花官方海报致敬曹赟定:队史第一人,代表申花中超300场

申花官方海报致敬曹赟定:队史第一人,代表申花中超300场

懂球帝
2024-05-01 22:34:15
“应该立即死刑!”央视新闻在4月14日曝光了一起惊天大案

“应该立即死刑!”央视新闻在4月14日曝光了一起惊天大案

元爸体育
2024-05-01 20:24:32
辽粤G1的五离谱:胡明轩违体、张皓嘉6分钟5犯,徐杰20分-30

辽粤G1的五离谱:胡明轩违体、张皓嘉6分钟5犯,徐杰20分-30

开心体育站
2024-05-01 23:50:33
4月电车交付“大乱斗”:比亚迪暂居第一,蔚来狂飙,小鹏继续掉队,小米SU7首月交付超7000

4月电车交付“大乱斗”:比亚迪暂居第一,蔚来狂飙,小鹏继续掉队,小米SU7首月交付超7000

华尔街见闻官方
2024-05-01 19:48:13
女人什么时候“生理需求”最强?这4个时间段,别错过了

女人什么时候“生理需求”最强?这4个时间段,别错过了

闻心品阁
2024-05-01 20:58:19
中医:最顶级的休息方式

中医:最顶级的休息方式

今日养生之道
2024-05-01 20:19:45
特朗普“掌上明珠”伊万卡:人间水蜜桃变胖大妈,背影比老公还壮

特朗普“掌上明珠”伊万卡:人间水蜜桃变胖大妈,背影比老公还壮

蜉蝣说
2024-05-01 20:55:04
美官员强硬警告中国,赖清德就职之日,不允许进行任何的轻举妄动

美官员强硬警告中国,赖清德就职之日,不允许进行任何的轻举妄动

杂谈天下式
2024-05-02 00:18:43
关键时刻队友掉链子?小卡缺战天王山,哈登26+7尽力了&东欧狂喜

关键时刻队友掉链子?小卡缺战天王山,哈登26+7尽力了&东欧狂喜

小闲人谈篮球
2024-05-01 18:29:21
2024-05-02 05:56:49

科技要闻

余承东卸任华为终端CEO 新任命为董事长

头条要闻

哥伦比亚总统宣布将与以色列断绝外交关系

头条要闻

哥伦比亚总统宣布将与以色列断绝外交关系

体育要闻

詹眉湖人:洛杉矶大型烟花秀

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

王石自动放弃2023年千万退休金

汽车要闻

预售2.89-3.49万 奔腾小马正式开启预售

态度原创

本地
家居
亲子
手机
公开课

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

家居要闻

心之所栖 黑白灰色系打造设计专属感

亲子要闻

一定要逼孩子做这四件事

手机要闻

TikTok 因绕过苹果 App Store 应用内购系统引起争议

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版
×