大众真的懂AI吗？专家为什么认为这是盲人在摸象？|ai|人工智能|计算机视觉|神经网络

分享至

网易科技讯 12月18日消息，在今日举办的网易经济学家年会人工智能论坛上，旷视科技首席科学家孙剑、中科视拓创始人山世光、第四范式创始人兼CEO戴文渊、同盾科技副总裁顾威同席参与了第一场圆桌对话，本场对话由乌镇智库理事长、《人工智能简史》作者张晓东主持，主题为“AI技术变革：趋势与方向”。

孙剑坦言，目前社会大众对AI的误区肯定是有的，因为通过宣传媒体，包括像AlphaGo这样的事件让大家觉得人工智能已经很快就到了，但是在学术界，大家其实觉得人工智能还很长远，还有很多基本问题都没有解决。山世光很同意这一观点，他同时将这种误区打比方为像盲人摸象的故事，“每个人的经验都是基于自己过去的一些研究的经历或者是开发的经历，所以即使从业人员对AI的理解也是片面的，就像盲人摸象，大家都没有一个全局的观念，因为没有一个人能够在这样一个时间点能够把所有的事情都搞得非常清楚”。

在戴文渊看来，人工智能和人类智能是两种不一样的东西，人的大脑工作原理和机器大脑的工作原理是不一样的，比如有一个运算能力特别强、记忆特别快的大脑，但它和人的归纳、抽象、总结其实方式和原理是不一样的。

顾威则将这种误区归纳为“真理总会有一个过程”，“人工智能未来就像互联网一样，互联网当时在90年代末期，大家觉得对它也有质疑，也有对它的理解有误区，到现在产生了BAT这样的一些巨头们。我相信在未来的5-10年不排除在座的企业里面就有未来人工智能的BAT。”顾威称。（锡安）

以下为本场圆桌对话主要内容，由网易科技做概要梳理：

一，社会大众对人工智能概念的理解是否有误区

张晓东：三十年前我到美国留学的时候，那个时候计算机里面就三伙人，一伙人是做理论的，还有一伙人是做系统的，包括软件、硬件。还有一伙人是做AI，做系统和做理论的人那个时候互相看不起，但是他们同时看不起做AI的人，这是30年前，现在的情况完全不一样。今天我想问一下台上的几位嘉宾，大家对AI的理解有没有误区？

张晓东

孙剑：误区肯定是有的，因为通过宣传媒体，包括像AlphaGo这样的事件让大家觉得人工智能已经很快就到了，或者很多事情都可以做了。在学术界的人觉得人工智能还很长远，还有很多基本问题都没有解决，但我觉得这也是蛮正常的。

孙剑

山世光：我也同意孙剑的观点，肯定是有误区的，而且这些误区可以打一个比方，像盲人摸象的故事，怎么理解呢？社会上确实有很多专家、科学家、技术人员在做人工智能，但是其实大多数人，或者说接近百分之百的人都是在做AI的不同的角度，比如说可能做视觉的基本上不太过多地关注做听觉的，做听觉的基本上不是那么关注做自然语言理解的。现在这个gap绝对能给大家更多的沟通，但是每个人的经验都是基于自己过去的一些研究的经历或者是开发的经历，所以即使从业人员对AI的理解也是片面的，就像盲人摸象，大家都没有一个全局的观念，因为没有一个人能够在这样一个时间点能够把所有的事情都搞得非常清楚。可能会过度地泛化，比如把AlphaGo的技术泛化到其他的问题上去，计算机视觉的人也会不自觉地把自己的一些在这个领域里面的进步泛化到其他的领域上去，这一点就会导致比较多的误解。

山世光

戴文渊：我觉得其实这个误区很多时候来自于高估或者低估。我举一个例子，刚开始创业的时候，那个时候是2015年，那个时候没有AlphaGo，我和很多的人说“人工智能”，说完这四个字，他们说人工智能我不感兴趣。我们过度在百度用人工智能技术帮助公司提供8倍的收益，他说你这是忽悠的吧？骗人的吧？到今天就不一样了，我还没去，他们可能就对人工智能感兴趣。我说提升8倍的时候，他说这个不够，还要更多。在之前我们对这个事情过度地悲观，现在又感觉过度地乐观，感觉好像人工智能在各个方面都能够去远远地超越人，甚至问的最多的一个问题是我以后会不会失业，这是一方面。另外一方面我觉得还有一个比较大的误区，就是说大家会把人工智能和人的智能之间建立一种联系。认为人工智能未来就是会达到或者超过人的智能的这样一种能力。但是实际上在我们看来，人工智能和人类智能是两种不一样的东西，我举另外一个例子大家会比较有感觉，比方说人去认识一个人的方式和狗去认识一个人的方式是不一样的，人认识人的能力强还是狗认识人的能力强？其实不一定，可能狗认识人的能力更强。一样的道理，就是人的大脑工作原理和机器大脑的工作原理是不一样的，那是因为这两个是不同的物种，每一个物种都按照他更擅长的方式工作。今天我们在做人工智能的时候，充分利用的是什么特？有一个大脑，这个大脑运算能力特别强，记忆特别快的时候，它怎么产生智能？它和人的归纳、抽象、总结其实方式和原理是不一样的，今天没法去详细展开，有机会的话其实我们可以在这个话题上进行更详细的探讨。

戴文渊

顾威：说到务虚的话，的确，因为现在大家都在说人工智能，乃至于上次我们同盾科技的创始人蒋韬开会的时候还受到主持人怼他，说现在是个人上来都谈人工智能，所以蒋韬说我都不好意思谈我们是在做真正的金融科技的人工智能了。但是感觉毕竟还是一个趋势，我想真理总会有一个过程。人工智能未来就像互联网一样，互联网当时在90年代末期，大家觉得对它也有质疑，也有对它的理解有误区，到现在产生了BAT这样的一些巨头们。我相信在未来的5-10年不排除在座的企业里面就有未来人工智能的BAT。谢谢。

戴威

二，人工智能近期革命的动力，究竟是不是算法？

张晓东：下一个问题。我想挑逗一下“群众斗群众”，上周南大的周志华周老师和计算所的高老师，两个人在微博上有一个互动，说人工智能最近几年的革命是因为什么引起的？大多数的认知都是人工智能的革命是因为算力的提升和数据。周老师表达出不同的意见，他说算法实际上在过去几年的提升也为人工智能做了巨大的贡献。我想听一听台上几位嘉宾，为了表示大家坚定的立场，你们只能选一个立场，你选哪一个？

孙剑：我的立场是和周老师一样的，因为其实计算力、大数据，我们看我们研究的很多问题，其实在小数据上、在计算力不是很大的时候也可以研究，过去的这些算法并不是一个点，而是这个算法中有很多很多点，重要的点加起来可能超过10个，这些点加在一起才让十几年前、二十年前，深度学习，或者人工智能网络的训练，当时可能个别顶尖高手可以呈现，别的老师不能呈现。今天通过很多努力，尤其是各种优化算法上的改进，以至于绝大多数数据都能呈现，以至于这个东西可以做了。今天依然有很多小数据在研究算法的改进，大的数据怎么检验？我觉得算法是比较根本性的。

山世光：我不知道后面两位站在哪一边，我站在孙老师的反边，更多人会觉得算法非常重要。我当时也觉得算法很重要，但是在台上我就想站在反边，这样可以有更多的角度。上个世纪80年代中后期的时候，那个时代人工神经网络，包括多层神经网络以及现在其实这一轮在整个的计算机视觉，包括语音识别等等这些领域带来了最大性能提升的卷积神经网络都是在那个时代产生的。卷积神经网络是1998年的时候Yann Lecun教授的一篇文章里面正式命名，但是实际上更早，1989年的时候就已经拿它来做数字的识别。如果再往前追溯其实是1980年的时候日本学者Kunihiko·Fukushima提出来认识神经机这样一个神经网络的做法，本质上其实都是一样的，而且在上世纪80年代末期的时候就已经证明了多层的神经网络，所谓的深度其实就是层数度，多层神经网络足以在理论上去逼近所有认为复杂的函数。

而我们现在做的大量工作都是这样子的一些逼近复杂的非线性函数的一个问题。所以如果这么说，其实在上世纪80年代、90年代，拴法上其实是跟现在非常非常像的。到2012年的时候，更多的是把层数增多，但是确实有很多的优化等等更多的进步。但是我们回想，如果是在上世纪80年代末期的时候没有大量的数据，也没有现在的算力，如果是在那个时候假设有现在的算力的话，我觉得这个进步可能就发生在那个时候了。包括大数据、算法、算力。为什么上世纪80年代不可能呢？那个时候的算力如果做现在的计算模型，估计至少是一年的时间，因为现在去做深度学习，加上GPU的服务器，现在很多东西还经常要训练少则三四天，长的可能还要一个月的时间。在那个年代的计算能力如果要做这样的训练的话，真的是一年都不太可能，一个算法的开发，一个技术的出现，一年前跑上去，一年后才能看到结果，结果好的话没有问题，结果不好还要重新调，这就不可能了，所以我觉得算力的提升是一个，不像现在做得这么好，欠了东风、欠了汽油，如果要点火的话。东风就是高性能的计算机，汽油就是大数据。所以我觉得这一轮的进步真的是，我们做算法的人其实要感谢做系统的人，也感谢互联网、物联网等等新的基础设施的出现，使得我们有了大数据。

戴文渊：我的观点，虽然这些都重要，但是实际上什么事情在当下最重要？往往都是那些不太被关注的地方是当下最重要的。比方说数据，数据我认为重要，但是实际上我自己最关注数据是在十年前，因为在十年前做AI没有数据，我们做不出来，后来到了互联网，有了数据，2008、2009年关注算力，BAT这样的公司有钱，能买机器，不到BAT做不出来。到了BAT要做算法，做什么算法？其实不是过去的算法的问题，而是过去的算法并不能随着数据量的增加把效果做上去，要做一个随着数据量增加效果会越来越好的算法，到今天其实这些都被大家充分关注了。我们其实很大的一个感触就是，比方说我们现在投入很大的精力在做体系架构，体系架构是现在往往被大家忽略的一个问题，很多人会觉得做AI就是做一个算法，做完算法以后找一个程序员把它实现一下就行了。

但实际上差别非常非常大，因为这个涉及到太专业的问题，我举一个例子，咱们开公司，一个人管十万人是不是要同样的管理方法？管一个人、十个人、一百个人、一万个人的方法都是不一样的，同样管一个机器、十个机器、一百个机器、一万个机器都是不一样的。我们创业的时候在民宅里面没有什么管理层级，任何两个人都可以互相说明，但是等公司到了大几百号人的时候，还能够让任何两个人互相之间说话就完蛋了，同时有一百人找一个人说话，那个人就崩溃了。所以为什么有汇报的体系、层级的结构？就是因为需要一个更好的机制。其实计算机也一样，计算机并不是水平扩展，那是我们的一个美好设想，并不是一个真正的水平扩展，而是需要一个好的架构，这个架构能够支撑你把这么多的算力放进去，额是在这个阶段我认为整个业绩所忽视的地方，而很多很多的系统、很多很多的应用最后没有能够做成，就是因为在这个地方做得太差了。

顾威：我的立场其实我是同意数据和算力是主要的因素，从算力上来讲，其实刚才孙总已经谈到了，我举一个例子，他谈到因为有了这么大的数据，我们的算法，其实现在很多算法当时也存在，很多年前也存在。它在模型开发，在跑这些算法、跑这些模型的时候，由于当时的算力，时间非常长，可能根本跑不出来。这是一方面。还有一个方面，就是有一个模型部署的过程，那个是模型开发的过程，开发就很长时间，你还有一个模型部署的过程。我们举一个例子，以前比如说我们在美国FICO有一个模型，就是刷卡和信用卡交易，实际上就是神经网络的模型，这个当时做了很大的工作，来保证它实时的计算。当时推广成本非常之高，所以很多小的也上不了，所以只能上来一个大的云服务，比较大的机构上去。我们中国在这一块基本上是空白，现在就不一样了，因为有算力在这儿，我们开发用比较短的时间，我们部署也满足实时的要求，这是在算力上的提升。

第二个就是数据，现在很多都是线上的，包括金融应用走上了线上化，用手机很轻松就可以申请一笔贷款，在手机提交的时间，包括手机相关的对应的一些行为的数据，有了这些数据的话，我们就可以做更多的整体的模型，不是以前传统的可能是看以前的信息，我再做一些核验。有了更多的数据、有了这些算力的提升，所以也使得新的算法、新的模型有了更好的应用。所以张老师，我的看法还是站在数据和算力这一块。

三，有没有资金风险问题？大量资本注入是否意味着泡沫？

张晓东：如果周老师能来的话，多数还是站在他的队伍中。我们经历了两次人工智能的起伏，这一次的人工智能，首先从融资规模上看，有几家公司融了大量的钱。上次在微软院委会上大家也聊起来，沈向洋还问同样的问题，第一，有没有存在资金风险的问题？第二，大量的资本注入是不是意味着泡沫？这个我想请孙老师先讲，融钱少的可以挑战。

孙剑：前两次人工智能泡沫，这次是不是泡沫，最大的不同是这次商业化的进程落地与前两次比起来都是非常扎扎实实的。我们旷视科技融了很多钱并不是因为做更深入的战略布局和深入的投资发展，计算力很重要，取决于更大的算力。最大的差别是业务做得非常好，这个钱主要是用来做战略发展，所以我觉得这次真的是跟以前是不一样的。

张晓东：我稍微插一句，因为其实不是人工智能这个行业，在整个中国的大的环境下，其实我们经历了几次，比方说两年以前滴滴打车那个行业，最近共享单车这个行业，一开始也有大规模的资金介入，后来很快会有合并，因为他们同质化竞争。所以我想再深入地请孙老师讲一下，比方说你们和你们的竞争对手都融了很多钱，那天沈向洋开了一个玩笑，将来这个行业会向哪个方向发展？

孙剑：计算机视觉这个行业不像自然语音处理，语音识别其实大家认为是比较单一的，但计算机是多样化的，图像识别只是其中之一，包括非常多的方方面面，包括运动、情绪，有各种各样的应用，还有各种各样平台上的应用，包括像新的iPhonex手机解锁的应用，非常多。所以我觉得虽然计算机视觉领域有一些创业公司，但是它和像滴滴或者是共享单车这样的单一目的非常明确一致性的这样同质竞争是不一样的，因为它运用的场景，我想山世光也会分享一下，其实我们有很多东西是不一样的。

山世光：我非常同意孙剑的观点。AI这个领域相比其他的共享单车或者是滴滴，它的不同就是碎片化特别严重，碎片化指的是需求不是特别标准，不是说我做一个东西之后，其他的马上都可以跟上去用了。即使是计算机视觉里面，甚至包括再细化到人脸识别这个领域，我真的觉得还是有非常多的可能性会存在多个公司去做。我们看上去好像就是一个人脸识别的技术，但是背后如果我们要细分场景的话，会有十几种不同的场景。每一种场景可能都需要你去积累不同的数据，甚至可能算法要相应的有改变。

再举一个例子，更广泛的讲计算机视觉。为什么说现在还会有这么多的公司存在？就是因为需求真的是五花八门，每一个需求过来之后，大家都需要扑上去搞数据。一帮人搞数据，一帮人搞算法，还要训练之后再部署，这个过程相对来说没有那么标准化，不是说可以做一个产品之后，其他的马上都可以跟上去。

我最近经常举一个例子，我们有一个客户他们做了一个巡逻机器人，在小区里面巡逻，业主和物业他们都觉得这个东西几乎没有什么用。但是他们觉得有一个东西可以有用，就是看这个巡逻机器人能不能监测狗屎，小区里面有狗和猫拉了屎之后，他们不能够及时清理，对于业主来说很不舒服，他们很不高兴。这个事情显然没有现成的，很多公司都可以做，但是需要花很长时间收集数据，之后去调算法，这个过程再快，特别顺利也需要三个月到半年的时间才能把这件事做完，这个听起来很可笑。今天是狗屎，明天就是塑料瓶子，后天就是白菜帮子或者是垃圾袋。如果我们每一个都花半年的时间去做，大家可以算一下，这个大千世界有万事万物，六个月是多长时间？这种做法目前也是受限于我们的技术开发水平导致的，使得我们的技术开发周期很长。大家没办法，就需要很多人，可能碎片化很严重，所以导致了至少在短期内没有特别强悍的工具出来之前，可能需要很多的人去做这样的一些事情。

刚才杨老师也分享了，可能很多人觉得我们公司是一个人脸识别的公司，我们叫视拓，这个“拓”也有拓展的意思。我们其中有一个方向就是面向计算机视觉领域做AI的开发平台，这个平台我们称之为Trainng as A Service，就是一个傻瓜相机式的算法开发平台，我们希望客户可以拿他们的数据，用我们的平台，出他们自己要的东西。这样的话，可能就使得我们AI的这种普及化会更加加速。这可能完全变成了一个不同的赛道，不再是一个纯粹的计算机视觉技术性、服务性公司的赛道。

戴文渊：其实我一直不太愿意谈资金的问题，虽然我们团队也不少，包括我们在公司里面，我也不太愿意去纯粹谈这个问题，这并没有意义，因为我们不是做自行车的，如果第四范式是一家做自行车的公司的话，我们每天都要讨论的问题就是我们拿了多少钱，要证明我们比竞争对手拿到了更多的钱，这是核心竞争力。但是AI公司不是说账上的现金最多竞争力就更强，融资同样是重要的。在我看来，AI公司比融资金额更重要的就是你拿谁的钱，怎么拿钱。实际上AI目前来看是一个To B的事情，To C是非常残酷的竞争，To B最后都是获得更快的增长，很重要的是你怎么去整合资源。在这个时候，其实不是说你拿多少钱的问题，而是拿谁的钱以及怎么去整合资源，这是一个方面。

另外一方面，现在谈论泡沫比较多。在我看来，现在我们这些AI公司拿到的所有的钱加起来远远低于我们每年给行业创造的价值，不是一两个数量级的问题。我们随便去服务一些我们的客户创造的利润，少则几个亿，多则上百亿，这些和我们现在融到的钱，和我们的估值比起来真的不算什么。所以如果看整个行业的话，我觉得倒不是说泡沫的问题，还应该要讲很多。当然肯定永远都会出现一家公司，任何一个行业都会有。如果你看一家公司，它是会有泡沫的，甚至会倒闭。但是看这个行业，我认为是完全没有泡沫，甚至还要再涨两三个数量级。

顾威：其实我真的还是很赞同刚才戴总讲的这个意思。因为以前我们就有过一个报告，就是传统的如果做数据分析的服务，它会带来超过10倍以上的回报，我们以前讲的是传统的受制于数据，受制于算例，受制于算法。现在有了人工智能，我们谈到这几个要素都已经具备的条件下，真的有可能会成多少倍的量级上去。从资本市场来讲，我觉得看好这一块，也代表着整个这是一个大的趋势。刚才我谈到了，正是因为有这个大趋势的存在，我们也非常看好人工智能在各个领域的发展。我们同盾是更加专注于金融领域的发展，也希望在人工智能的各个行业里面，我们未来会出现一个比较大的巨型公司，能够做出更好、更多的贡献。

四，人到底会不会被人工智能替代？

观众提问：IBM有一个机器人叫Watson，比如给一个医院放一个机器人给病人看病，医生会被代替吗？

孙剑：医疗非常复杂，而且很长，短期应该会被代替。

山世光：我从来没想过可能会代替。就目前来说，医疗有那么多的专科，有很多的科室，又很细化。这里面涉及到大量医生的经验，以及大量的数据如何能够形成一套非常好的诊疗手段，或者是一些诊疗的程序，这里面可能背后需要的时间太多了。可能现在更多的是在文本这个层面，理解这个层面，对于更多其他的一些角度还涉及得非常少。

戴文渊：医疗领域我的观点是，从技术角度来说，其实超越医生是完全没有问题的。您可以关注我们在上个月14日和瑞金医院一起发布了一个前糖尿病人的诊断模型，我们做过一个评估，已经比最好的糖尿病领域的专家能够提升两到三倍的诊断精准度，这方面完全没有问题。

另外一方面和无人车是同样的问题，技术上完全没有问题，但是推广的时候，你要让一个机器人去看病是很大的问题。就好像无人车，某种角度来说，好像比人开安全性提升了很多。但是你想，如果全世界的车都是一家公司在开，它每天要撞死多少人？一样的道理，如果全世界的医生都是由一家公司来提供，这家公司每天要医死多少人？这也是没有办法去承担的一个后果。所以在技术角度没有任何问题，但是在推广的角度来说，因为整个秩序可能要被重新构建，未来的医疗秩序是怎样的？这是我没有办法去评论的，需要产业界，包括整个国家层面要重新探讨。

顾威：我觉得戴总说的我特别赞同。从技术上来讲，应该是没问题，肯定是板上钉钉的，有这个能力。包括诊断上，前两天有一个公司也在介绍，他们所谓的智能的医疗诊断体系，可以把相关的这些信息数据采集到之后，有些模型他会帮助你去诊断。这个诊断一个是可以带很多新的医生，没有特别多经验的医生帮他做正确的诊断。另外即使你是有经验的医生，他可以帮助你辅助做快速的诊断，这个现在已经都在做了。所以总体上来讲，再往前发展的话，那就是怎么在人和机器之间更好的结合问题上，包括一些客户的体验。总体来讲，这个趋势是没错的。

山世光：我觉得要补充一下，我个人不太赞同技术上完全没有问题这样一个结论，现在还是非常大的问题，刚才说从医疗这件事情来看，最近几年有很大的进展，这里面有大量的问题没有解决，是不是目前的算法真的能够解决，我觉得还不是板上钉钉的事情，还需要时间来检验。

戴文渊：我们在具体的场景上可能不太一样，可能会出现一些领域，在技术上仍然有一定的问题，这些领域是在一些病人特别少的领域，我们也会发现数据量不够，当然这都是时间问题。绝大多数的病人数量足够多的场景下，现在技术上已经都没有问题了。我的观点，再加上前面的一个限制条件是这样的。

孙剑：大家可以理解一下为什么对人工智能有那么多误解，大家都有很多的看法。

张晓东：我知道台上的嘉宾也是意犹未尽，肯定台下的观众也有更多的问题，但是时间有限，后面还有更精彩的内容跟大家分享。感谢台上的各位嘉宾，也谢谢网易。希望有机会还有更多的时间跟大家沟通，谢谢大家！