网易首页 > 网易科技 > 网易科技 > 正文

一知智能全面升级跨媒体多模态人机交互中枢

0
分享至

颠覆人机交互体验感 妙语连珠的机器人是咋“想”的?

一知智能全面升级跨媒体多模态人机交互中枢

一知智能的音棚里,AI训练师正在优化人机对话相关数据。

近日,第二届中国(杭州)国际智能产品博览会暨2020全球人工智能大会在杭州国际博览中心举行。

在一知智能展位前,中国工程院院士潘云鹤驻足了很久。当他听完企业介绍后与同行的杭州市科技局局长赵喜凯说:“这种跨媒体多模态人机交互产品,是支撑未来机器与人多维度、跨媒体交互,建设‘数字中国’的大势所趋。”

一知智能全面升级跨媒体多模态人机交互中枢

一知智能是谁?鲜为人知,毕竟它是家成立仅3年的年轻企业。公司是一家专注于人机交互的人工智能企业,通过领先的NLP(语言处理)技术深度服务企业营销与客服场景。会议现场,一知智能正式上线跨媒体多模态人机交互中枢平台。简单点说就是,让机器人能眼观六路、耳听八方,不仅能说会道,还能读懂你的唇语,让机器人有“人的温度”。

这正契合了浙江大学人工智能研究所的跨媒体多模态人机交互研究方向,潘云鹤院士认为,“有很大的应用前景和想象空间”。

你以为和你说话的客服是小姐姐吗?NO!那是机器人。

潘云鹤院士的判断,源自对技术的理解和对行业的观察。

所谓跨媒体感知到多模态交互,就是要让机器像人一样,拥有眼、耳、口、鼻、手等五感的基本感知。“将语音、视觉、触控等多种传感器模态组合,即可形成跨媒体多模态人机交互的基本形态。”一知智能创始人、执行总裁陈哲乾说。

2017年,在各种人工智能比赛上崭露头角的陈哲乾、李一夫等人,在金沙江资本的邀请下,组团开启了创业之旅,并注册成立了一知智能,寓意“一问便知”。

“多模态交互,能够让人类在不同场景下选择不同的模态组合进行交互,进而从整体上提高人机交互的自然度。此外,不同模态之间还能形成信息互补,丰富机器人的情感和表达。”

据介绍,一知智能跨媒体多模态人机交互的系统框架,包括三个部分:多模态输入模块、认知和决策控制环节、输出模块。多模态输入模块包括麦克风、摄像头、电流信号等,可对人进行声纹、人脸、物体、动作、表情等进行识别,而认知和决策控制模块则通过AI算法对多模态信号进行思考学习,最后再给出决策响应。

一知智能全面升级跨媒体多模态人机交互中枢

基于这些底层技术,浙大·一知人工智能研究中心与微软亚洲研究院机器学习组合作研发了语音识别引擎、语音合成引擎和虚拟形象引擎,已经让机器人能眼观六路、耳听八方,还能说会道,甚至能读懂你的唇语。

“你电话另一端的机器人客服,你可以随意打断、提问,它都可以对答如流,你以为是小姐姐吗?不是,那是机器人。” 陈哲乾说。

人机语音交互应用场景很多,克隆语音给孩子讲故事都OK!

现状是,跨媒体多模态人机交互技术被广泛应用于呼叫行业。比如,中国移动、中国联通、中国电信及各大小银行和大型企业,都在用语音客服。

“一方面是因前置语音导航、语音识别不准等因素,用户体验并不好;另一方面,呼叫行业流动性大、培训成本高,市场需求巨大。”早在2017年,还在浙江大学读博士的陈哲乾,就看准了这一块市场。

有没有一举两得的方法,帮员工减负、帮企业提效降本?机器人替代人工无疑是最好的选择。“机器人没有情绪,不会出现辱骂客户的情况,而且能24小时在线,且能做到智能响应。”

比如,将跨媒体多模态人机交互中枢平台用于电力营销,机器人可根据参数设置智能判断哪些用户欠费,并进行语音提醒:“您好!你是**小区**单元的**吗?您已欠费***元,请及时缴清电费!”

目前,一知智能每月为国家电网拨打80万交费提醒电话,用户覆盖全省11家地市、42个县区。截至2020年9月底,累计催收电费金额超4亿元。

多模态人机语音交互还有很多应用场景。比如,快递司机智能招聘;银行信用卡逾期提醒;公安反电诈;交警扣分提醒;城管停车管理;智能家居及自助终端……

“我们甚至能克隆你的声音,你到我们录音棚来说几句话,机器就会自动学习你的音色,机器人就会模仿你说话了,完全可以模仿你给孩子讲故事,是不是很有趣?”陈哲乾说。

专门处理自然语言,致力于成为新一代数字生产力引领者

“一个人工客服的成本10万块的话,那机器人只需要1万元,这还仅仅是工资成本,还可以节约场地成本和培训成本。”

其实,阿里、百度、科大讯飞等企业,都瞄准了人机语音交互领域,但他们做的都是平台,而一知智能是从底层技术做到具体项目,并拥有自己的核心技术。

“我们的专业就是做自然语言处理的,包括语音识别的准确率和语音理解的准确率,一句话,就是要机器适应人。”陈哲乾解释说,“你跟小爱同学说,‘小爱同学,我要给**打电话’,它能听懂,但你说‘我要给**打电话,小爱同学’,机器就听不懂了,这就是我们要解决的问题。”

为此,一知智能跨媒体多模态人机交互中枢甚至能适应不同的语境。比如,能听懂带口音的普通话,能在嘈杂环境进行对话,甚至能进行多人对话……

目前,一知智能已与阿里、腾讯、华为、京东、百度等建立商务合作关系,并先后入局物流、水务、税务、银行、燃气等众多基建工程,还与顺丰、猎聘、德邦、建设银行、中国银行等几百家头部企业有深度合作,公司销售收入2020年每月增长速度达到30%。

一知智能全面升级跨媒体多模态人机交互中枢

为了让语音交互技术拥有更多可能性,陈哲乾和团队依然在探索如何让机器人语音更真实自然的答案。

在一知智能的墙上,有这样一句话:“致力于成为新一代数字生产力引领者。”这或许就是企业的初心和愿景。

相关推荐
热点推荐

路遇卖蛇的黑人孩子们,回忆我在非洲安哥拉的日子37

凡间事
2021-01-22 20:37:46

用汉字能描述的最大的数字是多少,官方也露头了

吴彦燊娱乐说
2021-01-22 02:06:13

微信终于可以查看访客记录了?

匡北北
2021-01-18 23:55:27

女子嫌弃楼下丧礼喇叭吵,大声辱骂,结果晚上去世的奶奶找来了

深夜故事君
2021-01-22 14:23:42

“大东亚共荣圈”有多可怕?若是此计划成功,全球将只有两个国家

一点史事汇
2021-01-22 08:40:02

实在不能忍了!美军机在台海太过分,台当局终于奋起反抗

利刃号
2021-01-22 18:33:58

“全网劝离”的河北确诊夫妻:一个人的付出,撑不起两个人的婚姻

陆琪
2021-01-19 17:50:02

开心一刻:坐月子和月嫂住,深夜老公喊我,月嫂竟死捂住我的嘴…

大明故事
2021-01-23 06:00:50

网易宣布投入10亿进军视频领域;薇娅在杭成立食品新公司,法定代表人为丈夫董海峰;奇点云获由字节跳动领投8000万融资

B座12楼
2021-01-22 15:37:35

深圳新首富诞生了,去年平均一天赚4亿,公司市值超过阿里巴巴

张老师说事
2021-01-22 16:46:07

陈小纭热舞秀火辣身材,高难度动作获赞无数,却因大胆言论惹争议

会火
2021-01-22 23:46:48

郑爽被正式封杀后,圈内人爆出更猛的料,网友:要惊动税务部门了

八卦宝宝
2021-01-21 02:25:23

B站UP主疑因“贫病交加”去世引关注,网友:很遗憾现在才认识你

中国经济周刊
2021-01-22 18:11:50

湖南卫视再出王牌之作,比《山海情》收视率还要猛,人民日报大赞

明星资讯知道
2021-01-21 11:00:11

远看地上有只老鼠,趴在那儿不知道干啥,凑近后:还是头一回见

兽医小明视频
2021-01-22 13:58:09

鲁迅人设崩塌现场!(还有其他猛料)

好奇博士
2021-01-19 14:55:48

刚刚!苏州工业园区最新通报:核酸检测结果均为阴性!

深度苏州
2021-01-23 12:14:59

莫里森还在装傻,澳一商品彻底退出中国市场,20年来首次出口归零

防务视野
2021-01-22 17:55:46

男歌手被爆私生活混乱,疑与近百名女性发生关系?还有特殊癖好?

会火
2021-01-10 23:00:18

郑爽不顾风波仍坚持弃养,机构负责人爆料:昨天打电话让机构抚养

食管学堂
2021-01-23 05:25:05
2021-01-23 13:57:02

科技要闻

王珮瑜:希望京剧出现更多现象级流量演员

头条要闻

拜登任命台裔赵克露接管美国外宣机构 台媒又嗨了

头条要闻

拜登被弹劾?特朗普首次发声 佩洛西下不来台了

体育要闻

打的就是精锐!KD观战 篮网被双杀

娱乐要闻

迪丽热巴穿白衬衫写福字 年味十足

财经要闻

汽车要闻

和奥迪A1同平台 全新斯柯达晶锐配置不比Polo差

态度原创

家居
手机
旅游
教育
时尚

家居要闻

新疆美女晒纯实木雕花豪宅 客厅两面墙摆满古董

手机要闻

荣耀V40体验:承上启下力作 不愁卖的新旗舰

旅游要闻

特技团队成员爬上360米高烟囱顶表演

教育要闻

老师们注意!试试这样布置寒假作业?有效又有趣!现在看还不晚

专访 周冬雨:我想玩点刺激的

×