网易科技讯 9月3日消息,在百度世界大会上,百度董事长兼CEO李彦宏表示,以语音搜索、图像搜索为代表,甚至“筷搜”这样的新兴方式,都说明用户的需求表达正朝着自然、人性化的方向不断发展,未来的科技也将更加回归自然、贴近人性。他还预测“未来五年消费者使用语音、图像来表达需求的比例将超过50%”,呼吁传统服务业要对消费者的行为变化保持敏感。
“用户行为的变化,也反应在百度的搜索请求上。”李彦宏指出,过去一年来,越来越多的搜索请求是有关于服务的——“用户到百度是来寻找服务,而不是简单地寻找信息的。百度作为一个搜索引擎,其作用正从连接用户和信息,转向连接用户和服务。”
对于传统服务业通过移动站、原生应用(native app)、第三方平台(如微信公众号)等方式拥抱移动互联网的尝试,李彦宏则通过医疗、航空、餐饮和汽车4S店等领域的一系列案例分析,揭示出上述模式所存在的问题与不足,并相信通过技术创新,类似“如何把握用户时代的机遇,让客户随时随地的直达你的服务”这样的问题将会得到一个满意的答案。
以下为李彦宏在2014百度世界上的主题演讲实录:
各位尊敬的来宾、企业家朋友们,大家上午好!欢迎来到2014百度世界。刚才主持人也讲了,百度世界是我们一年一度的技术创新大会,每年,我们都会利用这个时机,向大家展示在过去一年当中百度技术方面的创新成果。过去一年尤其特殊,因为我们每个人都能深切地感受到移动互联网这个大潮所带来的冲击和影响。
其实,移动不仅给互联网公司带来了巨大的影响和冲击,也给很多传统产业的从业者带来了巨大的影响和冲击。今天我们请到了2000多位嘉宾,我看到还有很多人站着。这些嘉宾当中,绝大多数都来自所谓的非互联网产业、或者说是传统产业,有娱乐业的、旅游业的、金融业的、教育业的、餐饮业的……各行各业。这说明大家都非常关心互联网、尤其是移动互联网给人们带来的影响到底是什么。今天我也想从这个话题开始与大家一起分享。
语音图像等非文字输入方式未来五年将超50%
移动时代消费者的行为在发生变化,我想这可能是每一个人都能感受到的。但是具体在发生什么样的变化,让我们来看一下。
这是我们熟悉的百度搜索:每一个人通过自己掌握的终端,以输入关键词的形式表达他的需求、并进入到这个搜索框,最后通过百度获得答案。这是有十几年历史的搜索引擎能够给大家带来的好处。
可是,移动互联网时代的到来给了用户新的可能性与新的机会。比如说,现在的搜索可以用语音操作。语音是一个更加自然的表达需求的方式。我们知道,文字的历史大约只有5000多年,语音的历史有多少年?至少有20万年。所以,它是一个更加自然、更加容易、更加低门槛的表达方式。在过去的PC互联网时代,人们不可能以这种方式向计算机和互联网表达需求,可是今天,这种可能性是存在的,不仅存在,我还可以告诉大家,现在进入百度的搜索请求中有10%是以语音的形式来表达的。
语音搜索已经变成很多人的习惯,很多人对于这种习惯的依赖度也是非常的高。我们看到,有一些人每天都会进行很多次的语音搜索。很多次是什么概念?使用语音搜索次数最多的人每天能达到多少次,50次?100次?我告诉大家,我们做了一个统计,一个人一天最多使用了500多次的语音进行搜索。而且我们发现,在每天使用400次以上语音搜索的人中,绝大多数都是儿童。这也印证了我之前讲到的:语音是一个更加自然、更加低门槛的表达方式。当一个儿童他还不会打字的时候,他可能已经可以用语音来表达他的需求了。
这是一个语音搜索的例子。“7年前姐姐的年龄是妹妹的4倍,7年以后姐妹俩的年龄之和是48岁,姐姐今年多少岁?”我们可以想像,这可能是一个小学二年级学生用语音输入的query。如果我们用文字表达的话,你输入这些字所需要的时间,可能比自己亲自算出答案还要长一些,或者干脆就不去输入了。但是当语音成为一种表达需求的可能时,你就可以很方便地用语言告诉百度,这是你想要的,我们也能提供答案。
除了语音之外,还有更为丰富的形式,就是图片。现在的百度也支持拍照搜索,也就是说,你可以用一个图片去找相似的图片。图片、或拍照搜索其实也是一种非常自然且低门槛的表达需求方式。可以说,当一个小孩在学会语言之前,他已经可以用眼睛来认知世界了。他们的这种认知和需求的表达,也可以通过现代的科技、通过移动互联网带来的技术创新来解决。所以,在百度可以支持拍照或图片搜索之后,我们也看到有很多人用这种方式向百度表达需求。
我们看了一下人们以图片搜索表达的需求,其中,需求表达最多的一个类型是与life style(生活方式)相关的。比如说,拍下一个包,就可以在网上看到哪里有卖这个包的;家具或者工艺品,有很多人拍这些东西去搜索,大家可以想象,这种搜索的商业价值是非常高的。这个类型的搜索占到拍照搜索的35.5%。
第二类占15.8%的搜索是什么呢?是Face recognition(人脸识别),就是通过人脸进行识别,自拍一个照片,输入后看我长的像哪个明星。或者在街上看到什么人,拍一下到网上看看有什么类似的图片。其实除了人脸识别之外,还有很多人拍人体的其他部位进行识别,这个我就不详细去讲了。
可能很多人都知道,在1943年,IBM一位非常传奇的CEO Tom Watson曾讲过一句经久不衰、被人们不断引用的话,他说:“I think there is a world market for maybe 5 computers.”( 我认为全球计算机的市场需求量大概是5台”)。而今天,每一个人手上的手机都是一台计算机。过去半个多世纪以来,文字、语音、图片等技术不断发展,这就让使用技术的门槛不断降低。比如说,无论是一个接受过大学教育的人,还是一个二年级的小学生,甚至婴儿,都可以用他的眼睛和视觉表达需求。这种创新在过去的一两年中在不断加速,所以,这是一个非常令人兴奋的时代,这是一个魔幻的时代。
现在,人们表达需求的方式有语音、文字、图片。那么展望一下,五年以后会是什么样子的呢?我认为,未来五年,使用语音和图片进行搜索的请求量会超过纯文字的请求量。这也是由于技术的进步。我们过去说一段语音,其中会有20%的字不能被计算机识别,那么整段话就被废掉了,所以,人们就不可能使用语音搜索表达需求。过去你拍一张照片,搜索出来的东西都是乱七八糟的,完全不是你想要的,那么你也不会再使用了。未来,随着技术的进步,以及计算机识别语音、图片的精度越来越高,我们就可以让人们用更加自然、更加低门槛、且更加方便的方式表达他们的需求。
其实不仅仅有语音、文字和图片可以表达需求,人们还有更多的表达需求的方式。今年4月1号,我们发布了一个概念产品叫“百度筷搜”,当时有很多人问我,Robin能不能给我一个,我想买这个产品。那时候我们没有产品,但今天我们有了,在外面的展台上,大家可以看到,百度筷搜已经成为了现实。
百度筷搜能做什么?可以测地沟油,把它放在橄榄油里面,它会告诉你这是高质量的油;放在炒过菜的油里面,它会告诉你这是低质量的油。百度筷搜还可以测水,放在高质量的矿泉水中时,它会告诉你这是一个弱碱性的水,放在受污染的水中它也能告诉你水质不好。未来,通过百度筷搜,你可以知道油、水等各种各样食物的来源是否变质、或有何营养成分,这是一种新的感知世界的方式,同时也是用户和消费者表达需求的方式。