网易首页 > 网易科技 > 网易科技 > 正文

第四范式首席科学家杨强:AlphaGo的弱点在迁移学习

0
分享至

【网易智能讯 5月29日消息】近日,机器之心主办的全球机器智能峰会(GMIS 2017)在北京召开,第四范式联合创始人、首席科学家杨强教授作为人工智能和迁移学习方面的专家,出席大会并发表了主题演讲,分享了关于迁移学习的最新研究。

杨强教授认为,AlphaGo并非“上帝”,它存在弱点,弱点之一就是缺少迁移学习的能力,我们人这种能力非常好,比如,人类在学会骑自行车以后,我们再骑摩托车就感觉非常容易对人类来说是非常自然的,但是人工智能还做不好。

此外,杨强指出,我们为什么需要研究迁移学习?首先,生活上我们遇到更多的是小数据,而在小数据上学习的模型,才是真正的智能。第二,我们希望构建的系统不仅在那个领域能够发挥作用,在其周边也可以发挥作用。即我们希望系统是可靠的,其可以举一反三和融会贯通,这也是我们赋予智慧的一种定义。第三,我们希望更重要的是如何能够把一个通用的系统加上个人的小数据,而迁移到个人的场景当中去,因此我们可以向个性化方向发展。迁移学习就是一个必不可少的工具。

那迁移学习目前有没有实例呢?

杨强教授举例说道,在汽车分期营销方面,我们知道汽车每一笔单都是非常大的,那么这种单的个数是非常少的,所以这个数据都是小数据,甚至小于一百个样本不过我们同时还有几千万数据量级的小笔交易数据,我们建立的模型能够一个小数据模型迁移到大笔订单上,我们利用迁移学习最后取得的效果是比传统模型要好200%。(易智)

以下为杨强教授演讲实录,略有删减。

大家好,我是杨强,我今天想分享一下大家可能都关心的一个问题,人工智能到底有哪些最新的进展。我先从最近比较热的一个话题开始,我们知道这一周在人工智能界最热的一个话题就是在乌镇人机大站。AlphaGo柯洁进行了三场比赛,这个比赛看上去非常的让人心潮澎湃,我们在里面到底学到了什么东西呢?这个是我今天要讲的。

首先柯洁给我们留下一句话,柯洁AlphaGo看上去像神一样的存在,好像是无懈可击,我们从机器学习的角度来说,它到底有没有弱点?我个人的观点它是有弱点的,而且这个弱点还很严重,这个弱点就是它没有迁移学习的能力。迁移学习是我们人的一种特质,这个特质体现在什么方面呢?首先,我们知道机器的一个能力是能够在大量的数据里面学习,因此数据的质量非常重要。但如何把在19×19的棋盘学到的知识,推广到21×21的棋盘,学会下围棋后能不能去下象棋,学会下围棋能不能把它用在生活当中、用在商业端、用在我们的日常活动呢?机器今天是没有这个推广能力的,这个就是我们今天要说的题目。

但是在说这个题目之前,我先要说几个我认为在AlphaGo2.0里面学到的知识,第一是今年的数据和去年与李世石下棋时大有不同,数据的质量提升使AlphaGo的水平大为提高,所以数据的质量非常重要。同时计算架构也很重要,阿尔法狗去年用了上千的CPU和上百个GPU,但今年只用了一个小小的TPU,去年用的计算架构和今年的计算架构是一种飞跃性的变化。同时算法也是非常重要的,让计算机自我训练,自我学习,这让我想起来有一个电影叫《模仿游戏》,图灵在研究德国潜艇密码的时候突然来了灵感,我们人是没有办法打败机器的,但是机器是可以打败机器的,机器的特点是什么?是自动运算。如果我们赋予机器一种能力,使其能够自我学习,那么它就能够在某些方面超越我们人的能力,所以这种自我学习的算法是极其重要的。

这三点对于商业领域,以及把人工智能落地也是非常重要的。我们思考下,在我们工作生活当中,我们遇到的人工智能应用是不是有高质量的数据,是不是有很好的计算架构,是不是有了一个自我学习不断提高的闭环。这三个条件是我今天要说的第一件事。

进入到我们今天主题,就是AlphaGo不能做什么,他的弱点在哪里。大家亲切的把AlphaGo叫“阿老师,这个老师应该也是有弱点的,他的弱点之一就是缺少迁移学习的能力。人这种能力是非常好的。比如,我们在学会骑自行车以后,我们再骑摩托车就感觉非常容易对我们人来说是非常自然的;我们看了一两个图片,我们就可以把它扩展到许多其他不同的景象,这种能力也是非常强的。我们有了一个知识,我们把这个知识再推广到其他的领域当中,这个能力说明我们人这个计算系统是有怎么样的能力呢?叫做可靠性,我们很鲁棒,我们能把过去的经验带到不同的场景,适应不同的环境。我们怎么样才能让机器也具有这种能力呢?

我现在给大家个例子,让大家去想一想国内的车本身是左舵,而香港的车是右舵,我们在北京学会开车以后如果去香港租车,怎么能够很快的学会在香港也会开车?这里面就是一个诀窍,我管这个诀窍就叫做迁移学习的诀窍,答案就是司机的座位总是最靠近路中间的,不管你是在北京开车还是在香港开车,大家不妨去试一试,这说明什么呢?这说明迁移学习的要素就是发现共性,发现两个领域之间的共性,如果一旦发现了这种关键的共性或者我们在机器学习里叫做特征,发现了这种共同的特征,那么迁移就非常的容易。

下面我要说一下为什么我们要研究迁移学习,首先我们遇到更多的是小数据,小数据上如何能够实现人工智能,就需要迁移学习。我们看到家里面小朋友,看一个图片的猫,他在看到一只真猫他就会说这个是猫,我们不用给他一千万个正例一千万个负例他就具有这种能力人是具有这种能力的,这样才是真正的智能。

第二个好处,是我们造了一个系统,我们希望这个系统不仅在一个领域能够发挥作用,在他周边的领域也可以发挥作用,当我们把周边的环境稍微改一改的时候,我们这个系统还是可以一样的好,这个就是可靠性,就是说我们可以举一反三,融会贯通,这个也是我们赋予人智慧的一种定义。

第三,就是我们现在越来越多的强调个性化,我们手机上面的东西,我们看新闻、视频,为我们做提醒,以后我们家里面有个机器人,这些都是要为我们个人提供服务的,这种服务越个性化越好,但大家有没有想过,个性的数据往往都是小数据,也就是说我们可以把几千几万几百万人的数据综合在云端,但那样做出的一个系统只是一个通用性的系统,我们更重要的是如何能够把一个通用的系统加上个人的小数据,就把它变成迁移到一个个人的场景当中去,我们不管是视觉,还是语音,还推荐系统,各方各面我们都需要向个性化发展,那么迁移学习就是必不可少的工具。

在说了这些好处之后,我们就来说为什么今天迁移学习还没有大规模的推广,这是因为迁移学习本身是非常非常难的,在右边这个图,其实他问的是学习迁移,我们知道在教育学里面大家对于如何能够把知识迁移到不同的场景也是非常关心的,在教育学这个理念已经有上百年的历史,就是说如果我们想来衡量一个老师的好坏,我们往往可以不通过学生的期末考试,因为那种只是考特定的知识,学生有的时候死记硬背也可以通过考试,一个更好的方法是观察这个学生在上完这门课之后他的表现,他有多大的能力能够把这门课的知识迁移到其他的课里去,那个时候我们再回来说这个老师他的教学是好是坏,这个叫做学习迁移,所以在教育学里大家就在问说为什么学习迁移是如此的难,这个难点就是在如何发现共同点。再回到我刚才开车的例子,我们在座有多少人经历过这种从左边开车到右边开车,然后非常苦恼的这种事实,就是说对于我们人来说,发现这种共性也是很难的,好在我们聚焦在迁移学习这个领域已经有了十年到二十年,取得了不错的结果。

我下面就给大家讲一下在这方面最近有哪些进展,些是现在正在进行的研究,也欢迎在座的大家来参与这样的研究。

第一个要点,如果我们要发现不同机器学习问题之间的共性,有一个办法是把问题的结构和问题的内容剥离开,这个事不容易做,但是一旦能够做成的话我们举一反三的能力就非常强了。大家可能不知道,在好莱坞专门有这样的训练班去训练如何写电影剧本,大家认为写电影剧本也许是一个需要非常艺术,以及天分的一个工作,但是大家可能不知道,写电影剧本这个学问也可以变得像一个工厂式的,怎么做呢?他的诀窍就是把内容和结构给分开,头一部分,头十分钟这个电影应该演什么,后五分钟这个电影应该演什么,在什么时候应该催人泪下,在什么时候让大家捧腹大笑都是有结构的。在经过几天的训练,你也可以成为一个剧作家,你也可以变成一个好莱坞的导演,那么怎么样才能够让机器学习也具有这种能力呢?在这个图的左边,我们看到是2015年的一篇文章,就是三个人在手写识别数据集上学习手写的结构和方式,结果发现在学习结构这方面用一个例子就可以了,这个叫做单个例学习,是机器学习界相当轰动的一件事。

在右边,我展示一下我的一个博士生吴宇翔同学最近在进行的一项研究,就是在大规模的文本上面,如果我们能够把文本的结构和具体的内容用一个深度神经网络来区分开的话,那么他学到的结构这部分就很容易来帮助我们自然语言系统来做不同的事情比如于识别主题、文本摘要、文本总结等,甚至可以学出应该用何种方式去产生这个文本。这样我们可以做一个机器人去自动写新闻稿,所以这个工作我觉得是非常有前途的。

第二个进展,是发现过去我们在学习方面太注重发现共性本身,却未注意在不同的层次之间发现这个共性。现在发现如果我们把问题给分到不同的层次,有些层次就更容易帮助我们进行知识的迁移。比如,在图像识别上如果我们在一个领域已经用上千万的数据,训练好了一个八层深度神经网络然后我们变化下问题的场景,传统的机器学习需要再次用上千万的数据,重新花很多时间去训练。但是现在使用这种层次性的迁移学习,我们会发现不同的层次具有不同的迁移能力那么这样对于不同的层次它的迁移能力我们就可以有一个定量的估计。所以当遇到新的问题,我们就可以把某些区域,某些层次给固定住,把其他的区域用小数据来做训练,这样就能达到迁移学习的效果,这个领域最近经常有一些新的工作出现。比如在语音识别中,如果我们已经训练出一个播音员的语音模型,如何把它迁移到一个带口音的语言环境中呢?如果我们发现有一些共性的内在的层次是语音共同点,我们就可以用这种层次化的迁移,这样用小数据就可以训练方言的语音模型了

同时我们对这个结构也可以像工程师一样,进行各种各样的变化,比方说我们可以在图像、文字之间发现他们语意的共性,这种共性如果我们用一个多模态的深度学习网络我们就可以把它的内部语意学出来,这样就可以在文字和图像之间自由的迁移,所以这种多层的迁移确实带来很多的便利。

第三个进展是过去的迁移学习往往是说我有一个领域已经做好了模型,我现在目的是要把它迁移到一个新的领域,从一个旧领域迁移到新领域,从一个多数据的领域迁移到一个少数据的领域,这种我们叫做单步的迁移,一步到位,但我们现在发现很多场景需要我们要分阶段来比如在我们学习当中,我们分四年去上大学,为什么?因为我们不能一蹴而就,需要把知识给分段,从一个课到下一个课都是有衔接的,正如踩石过河,我们需要依次踩一些石头才能到达对岸。用这个思想我们也可以来进行多步传导式的迁移,比方说我们可以建立一个机器学习的深度网络,这个网络的中间层既能够照顾我们目标领域,也能照顾我们原来的领域。同时,如果我们有一些中间领域,中间领域数据可以完全无监督的,它起到什么作用呢?它们把源领域和目标领域一步一步的衔接起来,比如ABBCCD。这样我们就可以定义两个目标函数,第一个左边,左下边的这个目标函数就是要你,比方说你的任务是分类,就是要你分类越准越好。第二个目标函数是用来区分我在经历这些中间领域的时候,我拿出哪些样本和特征来,使得他对我们的优化函数是有用的,这个就是右下角的这个目标函数。当这两个目标函数一起优化,一个旨在优化最后的目标,一个旨在选择最优样本,逐渐的就像右边这个图一样,我们领域的数据就被多步迁移到目标领域去了。

在最近斯坦福大学有一个实用的例子,就是利用卫星图像来分析非洲大陆的贫穷状况,他们也利用了多步的迁移,从白天到晚上的卫星图像是一步的迁移,从晚上的图像到晚上的灯光亮度到这个地方的发达程度,是第二步的迁移,通过这两步的迁移就成功的建立了一个模型,通过卫星图像来告诉我们说这个地方的经济状况、贫困状况。

第四个是学习如何迁移。过去20年中我们积累了大量的知识,上百种迁移学习算法,当我们遇到一个机器学习问题,我们到底应该用哪个算法?其实既然有了这么多的算法,这么多的文章,我们可以把它们这些经验总结起来用来训练一个新的算法,这个算法的老师就是我们所有机器学习算法数据,因此这种学习如何迁移就好像我们常说的学习如何学习,这个才是学习的最高境界,也即学习方法的获取,这里我们一个博士班魏颖就在做这方面的研究。他最后学出的模型效果,是给我们任何一个迁移学习问题,它可以在过去我们经验里找到最合适的算法;可以是基于特征的基于多层网络的,或者是基于样本的,甚至是某种混合的,所以这些都可以自动的完成。

这里举一个舆情分析的例子。我们知道舆情分析就是给了一些文本标注数据训练一个模型,然后给一些新用户的反馈我们就知道他是正面还是负面。比方说在微博或者推特上面,每一天都可以知道大家的反应,一个具体的应用大家现在到底是乐观还是悲观,对股市对电影的评价等等。但是这种迁移是很难的,因为我们往往面临的是两个领域,左边这个是带有标注的,右边这个是没有标注的,关键问题就是如何把左边和右边给连接起来,也即是我们如何能够建立词语和词语之间的联系,进而把具有标注的数据对应模型成功的迁移到没有标注的模型上。就是说把图上这些绿的词和绿的词应该是对应的,红的词和红的词应该是对应的,但是机器不知道这点,我们人是知道的,建立这种对应在过去确实是由人来做的,比方说keyword,就是这样来做它需要由人来提供这样的知识。现在我们发现原来舆情分析的迁移,其中这个文本当中的每个字都具有一个这种连接的能力,并不是说有些词是连接词,其他词都不是,每一个词在不同的程度具有大小不同概率,能够把两个领域连接起来,关键是机器如何能够自动的去发现它,我们利用我刚刚讲的学习如何迁移的,迁移学习的方法,能够自动的发现迁移学习的方法。

第五个进展,就是把迁移学习本身作为一个“元学习方法,赋予到不同的学习方式上。如果我们之前有一个机器学习模型,现在只要在上面套一个迁移学习的罩子,它就可以变成一个迁移学习模型,这种办法怎样才能实现呢?我们目前在强化学习和深度学习上尝试这样的试验,假设我们已经有一个深度学习模型一个强化学习模型,我们在上面做一个wrapper,能够把它成功的变成迁移学习模型。

我们举一个例子,这个例子是个性化的人机对话系统,假设我们一个通用型的任务对话系统可以在一般的领域进行对话,但如何能够把这个变成个性化的,能够照顾到每个人的个性兴趣呢?我们正在循环神经网络和强化学习做这样的试验。目前我们已经做了一个通用性的任务对话系统,然后通过几个个性化的例子,该系统就可以学会在这个状态之间转移当中找到一些捷径,这些捷径就相当于个性化的选择。

下面我进入到最后一个我要讲的进展,就是用数据生成式的迁移学习,我们最近听到一个比较热的名词,叫做生成式对抗网络,这个词听起来有点复杂,但是这个图就是很好的解释,我们大家都知道什么叫图灵测试?一个机器一个学生,然后这边一个裁判,最后机器分不清哪个是人,哪个是机器。这个生成式对抗网络他是说外面的裁判是一个学生,里面的那个机器也是学生,他们两个人的目的是共同成长,在问问题的当中,假设裁判发现一个是机器了,那么他就告诉你说你还不够真,你可以提高你自己,如果里面的这个机器发现他把这个裁判骗过了,他可以去告诉裁判说,你还不够精明,你还需要提高你自己,这样的两个人就不断的互相刺激就形成一种对抗,这个是共同学习的一种特点。所以这种生成式对抗网络,它的一个特点,就是通过小数据可以生成很多的模拟数据,通过这个模拟数据又来判定他是真的还是假的,用以刺激生成式模型的成长,这个就好象是在计算机和计算机,计算机和人之间的博弈,我们左边这里展示的是一个博弈树。我们就可以用这个方法来做迁移学习,这里举的一个例子是最近的一项工作,就是说我们用判别式模型来区分这个数据到底是来自源领域还是目标领域。我们让生成式模型就不断的模拟新的领域,使得到最后我们能够产生出一大堆新的数据,它的数据就是和真实的数据非常的一致,通过这个办法一个判别器在区分领域,另外一个生成器在生成数据,我们就可以通过小数据产生更多的数据,在新的领域就可以实现我们迁移学习的目的。

上面的迁移学习技术已经用在一些商业领域当中,这里举的一个例子是第四范式在汽车分期营销方面,我们知道汽车每一笔单都是非常大的,那么这种单的个数是非常少的,所以这个数据都是小数据,甚至小于一百个样本不过我们同时还有几千万数据量级的小笔交易数据,我们建立的模型能够一个小数据模型迁移到大笔订单上,我们利用迁移学习最后取得的效果是比传统模型要好200%。

最后,我想说在深度学习上我们已经有了很大的成就,我们今天在努力地在强化学习进行各种尝试但是我认为机器学习的明天是在小数据、个性化、可靠性上面,就是迁移学习,这是我们的明天。

谢谢大家!

相关推荐
热点推荐
“痛,轻点”,女领导低声的哀求,他有些不忍心了

“痛,轻点”,女领导低声的哀求,他有些不忍心了

户外阿崭
2024-03-28 14:58:36
凯特王妃复活节与威廉王子去度假:整个王室像成了卡米拉天下

凯特王妃复活节与威廉王子去度假:整个王室像成了卡米拉天下

小兔子爱旅游
2024-03-28 01:58:51
62岁周勇,任上被查!

62岁周勇,任上被查!

鲁中晨报
2024-03-28 17:09:05
A股回落,沪指午后失守3000点

A股回落,沪指午后失守3000点

每日经济新闻
2024-03-28 14:45:14
王文涛会见荷兰外贸大臣范吕文,就光刻机输华和加强半导体产业合作等议题深入交换意见

王文涛会见荷兰外贸大臣范吕文,就光刻机输华和加强半导体产业合作等议题深入交换意见

界面新闻
2024-03-28 08:31:21
银行女职员的出轨经历,老公出差不在家,上司赖在家里不肯走

银行女职员的出轨经历,老公出差不在家,上司赖在家里不肯走

马军情感故事
2024-03-27 11:24:58
撤回上市计划,变卖大量股份,阿里正式“摊牌”了!

撤回上市计划,变卖大量股份,阿里正式“摊牌”了!

资本百科
2024-03-28 08:55:40
微胖才是王道

微胖才是王道

健身狂人
2024-03-22 12:07:17
认怂了!旅行团37人被扣后续:调查结果公布,整个公司受牵连

认怂了!旅行团37人被扣后续:调查结果公布,整个公司受牵连

冬天来旅游
2024-03-28 11:01:58
戴安娜王妃冤魂通灵实录:全网最可靠揭秘,真凶竟是英国特种部队

戴安娜王妃冤魂通灵实录:全网最可靠揭秘,真凶竟是英国特种部队

古今档案
2024-03-27 14:26:44
格局打开!范冰冰帮范丞丞出手!

格局打开!范冰冰帮范丞丞出手!

八卦疯叔
2024-03-28 10:03:44
广东一夫妻因纵欲过度,导致老公精尽而亡,要小心,不是开玩笑!

广东一夫妻因纵欲过度,导致老公精尽而亡,要小心,不是开玩笑!

今日养生之道
2024-03-24 07:30:15
闹大了!成都语文毒试卷新进展,学生说实情,家长透内幕,网友怒

闹大了!成都语文毒试卷新进展,学生说实情,家长透内幕,网友怒

遇见小路
2024-03-26 14:09:20
赵露思因丑照被范思哲取关!全球代言人被打入冷宫!

赵露思因丑照被范思哲取关!全球代言人被打入冷宫!

娱乐圈酸柠檬
2024-03-28 14:20:16
女主播直接报价格,10000玩一天,最低要一次性支付20天的费用

女主播直接报价格,10000玩一天,最低要一次性支付20天的费用

新游戏大妹子
2024-03-27 11:03:47
才播4集,拿下评分9.6,这是开年第一部值得我熬夜追不停的黑马剧

才播4集,拿下评分9.6,这是开年第一部值得我熬夜追不停的黑马剧

娱乐白月光
2024-03-19 10:18:15
李铁一审还没消息!此前陈戌源、于洪臣一审开庭信息均在17点公开

李铁一审还没消息!此前陈戌源、于洪臣一审开庭信息均在17点公开

直播吧
2024-03-28 17:08:13
让人醍醐灌顶的一段话: “你活着的时候,没有几个人观看...

让人醍醐灌顶的一段话: “你活着的时候,没有几个人观看...

户外阿崭
2024-03-27 09:05:08
“吃一顿饭,做4次爱”:2022最恶心的男人出现了!

“吃一顿饭,做4次爱”:2022最恶心的男人出现了!

黎兜兜
2022-09-15 20:39:33
于文文演唱会现场私处清晰可见?真相远比想象的还要恶心

于文文演唱会现场私处清晰可见?真相远比想象的还要恶心

莫问先生
2024-03-26 22:56:49
2024-03-28 18:52:49

科技要闻

王传福称合资品牌份额将降到10%

头条要闻

美媒:马克龙"派兵"言论招致朔尔茨不满 还激怒美官员

头条要闻

美媒:马克龙"派兵"言论招致朔尔茨不满 还激怒美官员

体育要闻

池江璃花子:我不打算输

娱乐要闻

莱昂纳多与25岁新女友互相投喂超恩爱

财经要闻

疯狂!三个城市,三个地王!

汽车要闻

混动增程双模式 长安UNI-Z售11.79万起

态度原创

健康
数码
旅游
教育
时尚

早防早筛,远离肝硬化

数码要闻

顶级锐龙9+满功耗4060显卡!华硕天选5 Pro 8299元限时抢购

旅游要闻

在广西不洗澡,是不是犯了天条啊?

教育要闻

由一个视频和一篇文章说说文化教育以及美国的一个民调数据

女团人手一副的nerd风眼镜,原来真的那么好戴!

无障碍浏览 进入关怀版
×