网易科技讯11月30日消息,据连线杂志报道,如果你问谷歌搜索应用:“世界上飞得最快的是什么鸟?”它会为你提供这样的答案:“游隼。据YouTube视频显示,这种鸟的最高飞行时速为389公里。”这是个正确答案,但它并非来自谷歌内部的主数据库。当你提出问题时,谷歌搜索引擎会重新定向到YouTube视频,里面描述了地球上飞得最快的五种鸟类,然后它会从中提取你在寻找的信息。此外,谷歌给出的答案没有提及其他四种鸟类。
如果你问“光明节会持续多少天?”或“图腾(Totem)有多长?”等问题,谷歌搜索应用也会给出类似答案。搜索引擎知道,《图腾》是太阳马戏团的杂技表演,它会持续2个半小时,包括30分钟的中场休息。谷歌搜索引擎是在深度神经网络帮助下回答这些问题的。深度神经网络是人工智能(AI)的一种形式,它不仅正快速重塑谷歌的搜索引擎,也在改造着整个谷歌,还有Facebook、微软等其他互联网巨头。
深度神经网络属于模式识别系统,可通过分析大量数据学习如何执行特定任务。在上述情况下,它们已经学会了从网站上相关网页上提取长句或段落,并从中提取重点,为你提供正在寻找的信息。这些“句子压缩算法”可以用来处理对人类来说相当简单,但对机器来说非常困难的任务。
谷歌的神经网络被称为Pygmalion,这种技术展示了深度学习正推进自然语言理解的艺术,大大提高对自然人类语言理解并作出回应的能力。谷歌搜索团队经理、负责句子压缩工作的大卫·奥尔(David Orr)说:“你需要使用神经网络,至少这是我们发现的、唯一能帮助理解自然语言的方式。我们必须使用所有最先进的技术。”
负责训练谷歌神经网络的人,是许多拥有博士学位的语言学家组成的团队。实际上,谷歌的机器学习如何从文本的长字符串中提取相关答案,是一遍遍观察人类类似行为学会的。这些艰苦的努力显示出深度学习的力量,同时也暴露出其局限性。为了训练类似的AI系统,你需要人类智慧筛选海量数据。而这类数据的获得通常并不容易,也并不便宜,而且其需求不会很快消失。
为了训练谷歌的人工大脑,奥尔及其同事还充分利用以前的新闻报道。通过了解标题,机器学会将其作为长文的摘要处理。但是现在,谷歌依然需要其语言博士团队。他们不仅需要向谷歌机器演示如何压缩句子,还要标出句子中的各个成分,以便帮助神经网络理解人类语言的工作原理。通过全球100多位语言学家的努力,Pygmalion团队获得了奥尔所谓的“黄金数据”,而新闻报道被称为“白银数据”。白银数据依然有用,因为其数量非常庞大。但是黄金数据才是最重要的。
这种需要人类辅助的AI被称为“监督学习”,如今它只涉及神经网络如何运作。有时候,许多公司可以众包这项工作。举例来说,互联网上的人已经在猫类照片中标记处数以百万计的猫,以便于令其更容易训练神经网络,帮助神经网络更轻松地识别出猫。但在其他情况下,研究人员别无选择,只能自己标记数据。
深度学习初创企业Skymind创始人克里斯·尼克尔森(Chris Nicholson)说,从长期来看,这种手工标记数据的规模不会太大。但是将来会急剧增加,它们令人感觉非常枯燥,这些工作不该是拥有博士学位的人去做。此外,除非谷歌招募各类语言专家时,这些系统才会真正发挥作用,其局限性十分明显。奥尔表示,现在他们的团队可以覆盖20到30中语言。但像谷歌这样的公司,最终可以开发出更自动化的AI形式,即所谓的“非监督学习”。
届时,机器将可从无标记的数据中学习,来自互联网或其他源头的信息将更加庞大。目前,正在进行这个领域研究的公司包括谷歌、Facebook以及OpenAI,后者是伊隆·马斯克(Elon Musk)创建的机器学习初创企业。但是距离实现这个目标还很遥远,AI需要Pygmalion的帮助。(小小)