网易首页 > 网易科技 > 网易科技 > 正文

谷歌想要给你的计算机带来个性 何时能实现呢?

2017-10-13 14:43:12 来源: 网易科技报道
0
分享到:
T + -

Members of Google’s personality team are trying to make its digital helper, Assistant, sound more like a person

网易科技讯?10月13日消息,《时代》(Time)发布文章称,谷歌的个性团队成员正在试图使得它的数字助手Google Assistant听上去像是人类,给你的计算机带来个性。

以下是文章主要内容:

在谷歌总部,几位作家在围着一块写着各种想法的白板。它们看起来像是骷髅杰克(Jack Skellington)可能会写下的那种东西:“万圣节求生背包”,“如何打败怪兽。”对于37岁的莱恩·杰米克(Ryan Germick)来说,有个想法尤其抢眼。“去年人们不喜欢‘闻我的脚’,”他笑道。他的同事艾玛·科茨(Emma Coats)解释道:

?“这是‘不给糖就捣蛋’的小游戏,其中一个回应是‘闻我的脚。’人们都唯恐避之不及。”

那个下午,杰米克一直处在像这样的头脑风暴会议当中。期间,谷歌员工们讨论生活中的一些重大问题,比如冒泡的大汽锅的声音和远处传来的嚎叫声哪个更加吓人。这些都是他作为谷歌语音助手Google Assistant首席个性设计师的职责的一部分。该语音助手服务已经出现恶劣各式各样的智能手机上,同时也登陆了谷歌去年秋季开售的Home智能音箱。

创造个性

这时候是8月份,但杰米克的团队却在考虑用户在万圣节可能会问谷歌什么问题,为什么会有那些问题。人们会问Google Assistant给些装扮建议吗?又或者,他们会想要听到很合事宜的笑话吗?Google Assistant的创造者们认为,回答这些种类的问题的关键在于,不要像我们大多数人那样看待谷歌,即把它看作不带感情的信息提供者,而应当把它看作一个充满活力的角色。Google Assistant产品管理主管莉莲·林孔(Lilian Rincon)表示,“简单来说,就是我跟谷歌说话能不能就像我现在跟你说话那样?”

这项任务实际上比它听上去要更加困难。在过去几年里,开发声控设备已经成为硅谷竞争最激烈的科技竞赛之一。Google Assistant进入三星、LG等Android手机厂商的产品。亚马逊在它颇为流行的Echo智能音箱上提供它的语音助手Alexa。苹果已经将Siri整合到各款iOS设备当中。微软也将它的语音助手服务Cortana推向从笔记本电脑到恒温器的各式设备。

虽然有如此之多的公司在争相打造各种支持倾听和对话的设备,但要具体预估该类技术多快会成为市场主流并非易事。但根据市场研究公司eMarketer的数据,今年,有6050万美国人每月至少使用一次Alexa、Google Assistant或者其它的虚拟助手。Gartner的分析师预计,到2021年,全球智能音箱销售额将达到35.2亿美元,较2016年增长近400%。许多科技行业专家都认为,语音是人机交互的下一个重大转变。“这将成为一种全然不同的互动方式,”艾伦人工智能研究所CEO奥伦·埃齐奥尼(Oren Etzioni)指出,“当你能够跟像酒店礼宾员那样的虚拟助手对话的时候,这真的会引发巨大的变革。”

但对着计算机喊出指令,跟与之进行对话完全是两回事——这让谷歌处在不同寻常的位置。该公司开发的技术能够索引海量的网络信息,做到人类无法做到的事情,它也由此成为全球最具价值的企业之一。现在,它的未来前景可能取决于它能否教导机器执行一项对于大多数人而言再简单不过,但对于计算机极其困难的任务:闲聊。为此,该公司寄望于一个不在它平常的招聘范畴内的左脑型创意人才团队:小说作家,制片人,视频游戏设计师,共情专家,喜剧演员。如若他们成功的话,那他们就将给谷歌带来某种它以前从未有过的东西:个性。

让Google Assistant变得像人

数字助手算不是什么新鲜技术。1952年,贝尔实验室的Audrey计算机能够识别口头说出的数字,但它要消耗大量的计算能力,无法理解所训练的语音。1990年,Dragon Systems推出Dictate,该软件拥有3万术语词汇量,但需要说话人每说出一个词都要停顿一下。1997年,该领域迎来了一个典型的失败案例。那一年,微软推出Clippy卡通纸夹,该产品旨在预测Office用户的需求和回答问题。但实际上,Clippy比C-3PO更加糟糕,时不时弹出造成干扰,帮倒忙。(幸好它不会说话。)该功能成了笑柄,最终在2007年彻底退出历史舞台。

直到6年后,Clippy背后的那个好点子——预测你接下来可能需要的信息,适时提供合适的贴士——在苹果Siri上成形。它可理解特定语境中的问题,经过一定的智能技术处理后会大声作出回答。此外,它相当风趣幽默。很快,苹果的各家竞争对手纷纷效仿,争相开发类似的技术。

谷歌Google Assistant团队成员没有忽视数字助手的这段失败史。曾在万圣节将自己打扮成Clippy的杰米克指出,未来的数字助手得不仅仅是问答机器。毕竟,谷歌搜索在那方面已经做得非常出色。“我们希望你能够跟这种角色建立连接,”他说,“它部分要做的就是理解人类的经历和人类的需求,它不仅仅要能够提供信息,还要懂得如何与人们建立联系。”

情感联系

让那种角色变得合理的任务落在谷歌个性团队身上,他们一直在致力于将Google Assistant变成像是人类而不是假装是人类的数字助手。(那是Google Assistant没有取像Siri或者Alexa这样的拟人名称的部分原因。)作为个性团队的角色负责人,科茨拥有数年的虚拟角色开发经验。她在皮克斯动画工作室供职了5年,曾参与《怪兽大学》(Monsters University)?、《勇敢传说》(Brave)、《头脑特工队》(Inside Out)等电影的制作。“要花很多的心思去思考除了面部表情以外,还可以利用哪些其它的工具来进行情感联系。”

科茨谈到了谷歌在琢磨生动但不会引起误导的回答时会考虑的问题。当中包括:用户希望从互动中得到什么?谷歌能够如何以一种积极正面的态度作出回答?如何能够让对话进行下去?科茨举了一个例子:被问到是否怕黑的时候,Google Assistant不会给出表明它怕黑的回答。相反,它会说,“我喜欢天黑,因为天黑了星星会出来。没有星星的话,我们就无法了解行星和星座。”科茨解释道,“这是一项来自谷歌的服务。我们想要它变得尽可能地健谈,而不去伪装成别的东西。”

这往往涉及先分析某人询问特定问题的言外之意。被问到“你愿意嫁给我吗?”的时候——谷歌称这个问题被问了成千上万遍——Google Assistant不会直接给出回答,而是转而说它很高兴主人想要得到更多的承诺。

像这样的问题要么是问着玩的俗套问题,要么是发自于复杂的情感。虽然任何向Google Assistant求婚的人都不大可能想要得到一个认真的回复,但该公司正在试图系统性地理解提问者的情感状态有多大的不同。在谷歌担当共情设计师的丹妮尔·克蕾特克(Danielle Krettek)的职责就是帮助创意作家理解那一点。克蕾特克的角色很容易被视作是情感解读者。坐下来跟她交谈没多久后,我就明白为什么会这样:她热情奔放,充满活力,任何时候看她的面部表情,就能知道她的情绪状态。“有的东西人们是能够感觉和表达出来的,有的东西则表达不出来。”她说,“我解读那些东西的能力就是我对这个团队的贡献。”

克蕾特克从人体验情绪的不同方式的角度来谈论她的各位同事,尤其是那些相似但容易搞混的情绪。她可能会钻研失望情绪会愤怒情绪有多大的不同,又或者为什么放松自如的感觉会跟满足的感觉不一样。这应当有助于作家们想出带来共鸣感的回答。以Google Assistant对于“我觉得身心俱疲”的回答为例,它回复道,“你觉得很心烦吧。怎么才能帮到你?”克蕾特克说道,“那种理解会让人觉得自己的感受被看见,自己的需要被听见。它就像是一种眼神接触。”

如何推进对话

Google???s personality team draws on a broad range of sources to hone the character of the company???s voice-enabled Assistant. Writers use notes and doodles to track potential ideas that eventually show up in products like this white-and-brass-colored Google? Home, top center, and the Pixel smartphone, bottom right.

谷歌的个性设计师有时候从意想不到的地方获得灵感。据科茨和杰米克透露,即兴剧是最重要的灵感来源之一。那是因为即兴剧需要推进会话,鼓励参与者不断相互接话——被称作“是的,而且”(yes and)的原则。杰米克表示,谷歌个性团队的几乎所有成员都曾做过即兴剧。

从问Google Assistant它最喜欢的冰淇淋口味的例子中,你就会了解到“是的,而且”原则。“我们不会说,‘我不吃冰淇淋,我身子都没有。’”杰米克解释道,“我们也不会说,‘我喜欢巧克力冰淇淋,我每个星期二都会跟妹妹一起去吃,’因为那也是不实的。”在这些情况中,作家们会思索普通的回答来让用户继续对话。例如,对于那个冰淇淋问题,谷歌会回答像这样的话,“选三色冰淇淋错不了,它总有适合你的味道。”

不过,让对话进一步展开对于Google Assistant而言仍然十分困难。问它三色冰淇淋中的特定口味,比如香草味或者草莓味,它会被难倒。谷歌的数字助手也难以应对对话中的一些常见情况,比如理解措辞上不同于系统所输入的问题的特定请求。另外,谷歌能够用来理解用户需求或者他们的情绪状态的工具相当有限。例如,它无法光根据用户的语调来分辨他们是喜是忧,是不是很疲倦。它也肯定无法觉察用户的面部表情变化。

对于用户,谷歌目前要解决的最佳特征是他们的历史记录。通过了解用户以往问了哪些问题,最常使用哪些功能,它能够试着去避免给出重复性的回答。未来,谷歌希望根据用户与Google Assistant的互动方式来更加广泛地理解他们的偏好。“我们还没有完全做到那一点,”杰米克说道,“但我们将能够开始理解,特定的用户是那种喜欢开玩笑的用户,还是那种严肃的用户。对我来说,圣杯就是我们能够真正理解人的语言,达到我说出的任何话几乎都可以理解的地步,”他说,“即便我在情感上有弦外之音,又或者涉及某种习语。”

那具体会在什么时候实现,还是未知之数。问遍硅谷从事语音技术的人,包括谷歌的人才,他们基本都是给出像“现在还言之尚早”这样的回答,也就是说“没有人知道答案。”

研究音调的细微变化

与此同时,谷歌在专注于研究音调的细微变化。Google Assistant告诉你天气状况的时候,它会着重强调像“基本”这样的词语。又或者,你可能会注意到,当它在句子开头说“不”的时候,它的声音听上去略有上扬。那些细微的音调变化是有意而为的,它们可能就是詹姆斯·吉安哥拉(James Giangola)正在做的事情。作为谷歌对话和个性设计主管,他是语言学和韵律学(研究语言的抑扬顿挫)的专家。

在我会见的所有谷歌个性团队成员里,吉安哥拉是最像工程师的那一个。他来与我会面的时候准备了笔记和谈话要点。他非常严肃,但也很兴奋地告诉我,做好语音交互对于科技公司来说为什么会那么重要。“语音用户界面至关重要,因为声音很大程度上是个人社会身份的一个标记。”他说。跟很多其他的Google Assistant团队成员一样,吉安哥拉在交谈中也常常将语音用户界面简称为“VUI”。“海伦·凯勒(Helen Keller),”他表示,“声音代表你在社会中的位置。”

他的职责还包括选派和指导谷歌聘来的演员给Google Assistant配音。在供职于谷歌之前,吉安哥拉曾在苹果参与Siri初始版本的开发。他给我播放了一段他在工作室与Google Assistant配音员共事,指导她进入角色的视频。(谷歌拒绝透露配音员的身份。)在该特定的场景中,吉安哥拉扮演经理的角色,询问谷歌最近与一位应聘者的面谈进行得怎么样。Google Assistant目前还无法帮助处理该类任务,但未来或许可以。

Google Assistant配音员以一种似乎很有谷歌特色的方式回答道,“他准时出现,佩戴了一条漂亮的领带。”说的没错,听上去很正面。她的声音跟她饰演的那个无生命的管家的声音几乎无法分辨,就只是她说“领带”(tie)一词时略有破音才让我想到说话的是个人。那也让我想到,如果Google Assistant无法理解口语的微妙之处,那它的声音不管听上去再真实,也无补于事。跟Google Assistant说“我很孤独”,它会背诵出克蕾特克等人帮助精心设计的、带有同理心的回答。但跟它说“我觉得没人喜欢我”,它会回答它听不懂。

重重挑战

对于谷歌和它的竞争对手来说,它们要处理一些比解读语音基本元素更加基本的问题。先吸引用户便是一个很重要的问题。谷歌通常都不公开Google Assistant的用户使用数据,但根据市场研究机构Creative Strategies去年的一项调查,人们说他们很少或者有时候使用语音功能:70%使用Siri,62%使用Google Assistant。

隐私问题是另一个日渐加剧的隐忧。例如,今年早些时候,来自亚马逊Echo智能音箱的周围环境录音在阿肯色州的一起谋杀案审讯中作为证据被提交上去,这是由人工智能驱动的设备记录的数据第一次被用于美国法庭。像Echo和谷歌Home这样的设备一直在收听,但不会将信息发送回开发商,除非它们有被唤醒——以Google Assistant为例,就是有人说“O.K., Google”的时候。但考虑到像亚马逊和谷歌这样的公司是通过尽可能了解你来赚钱的,在家中放置联网的传声器的主意会让很多人感到不安。谷歌表示它有在它的网站上明确列举它从其设备收集的数据类型,还指出它的Home音箱上方有指示它处于收听状态的提示灯。

然后,谷歌还面临一个根本性的难题。计算机还远未能够在人们发出请求或者提问的时候察觉可能反映他们的感受的线索。要做到这一点,Google Assistant需要从大量描绘用户在不同情绪状态下的声音的数据当中进行学习。“训练数据通常都包括相对平静的环境中的普通声音。”卡内基梅隆大学计算机科学学院语音技术研究所主任杰米·卡博内尔(Jaime Carbonell)指出,“通常来说你无法让处在巨大压力下的人提供数据,在所有的这些状况下收集声音数据极其困难。”

让更多的设备进入家家户户会带来帮助。10月4日,谷歌发布了两款新的Home智能音箱,包括一个相对小巧便宜的版本和一个高端版本。但亚马逊在该领域仍遥遥领先。据eMarketer估计,2017年,亚马逊Echo音箱将占据声控音箱市场70.6%的份额,谷歌将仅占23.8%。

不过,杰米克对此并不担心。他也对Google Assistant的缺点毫不讳言。我问他他希望Google Assistant变成哪一种科幻片AI产品,他没有选择像《钢铁侠》(Iron Man)电影中的Jarvis或者《她》(Her)中的Samantha那样超级先进的、无所不知的品种。他说,他希望让Google Assistant变得像Netflix的情景喜剧《我本坚强》(Unbreakable Kimmy Schmidt)中艾丽·坎伯尔(Ellie Kemper)扮演的角色Kimmy。虽然被邪教绑架关在地牢15年之久,还遭到了愚弄,Kimmy却仍能够看到积极的一面。

“我们常常讨论她令人难以置信的乐观,”杰米克说道,“就像她从地下室出来的时候那样,我们并不是总能够理解语境,但我们会尝试保持积极乐观。”个性就是这样:古怪也能成为个性魅力的一部分。(乐邦)

姚立伟 本文来源:网易科技报道 责任编辑:姚立伟_NT6056
分享到:
跟贴0
参与0
发贴
为您推荐
  • 推荐
  • 娱乐
  • 体育
  • 财经
  • 时尚
  • 科技
  • 军事
  • 汽车
+ 加载更多新闻
×

杨晓渡答“为什么高官落马前仍能升迁”

热点新闻

猜你喜欢

阅读下一篇

返回网易首页返回科技首页
用微信扫描二维码
分享至好友和朋友圈
x