百度副总裁、AIG平台总负责人王海峰
本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!
【网易智能讯 1月17日消息】今天下午,百度在北京召开百度输入法8.0新版本发布会。
百度副总裁、AIG平台总负责人王海峰在现场表示,语音输入不是全部,未来输入法一定是全感官输入的方式,将会有很多的AI技术进入输入法当中。据百度现场公布的数据显示,截止目前百度输入法的月活用户已经达到4亿,语音日流量突破2.5亿。
据百度输入法负责人蔡玉婷介绍,新的输入法不仅支持原有的语音输入功能(如语音修改、语音翻译、语音语音轻声识别、语音联想表情、OCR扫描输入等),最大的改变就是采用了第二代深度尖峰技术和增加了语音速记和AR表情两大功能。
Deep Peak2
据百度语音技术部总监高亮讲述,百度输入法搭载了百度第二代深度尖峰技术(Deep Peak2),基于LSTM和CTC的上下文无关因素组合的建模。建模单元比之前更少,解码速度较之前提升了10倍。据高亮表示,该模型可以大幅提升中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率。
华少挑战百度输入法
在现场,主持人华少用极快的语速挑战了百度输入法的语音输入功能,58秒钟读出了426个字,百度输入法正确识别。
百度输入法8.0版本增加了语音速记功能,这项功能分为单人模式和多人模式。值得一提的是,语音速记还支持声纹识别区分角色,在多人模式下,百度输入法可以区分出2-3个不同的人声并自动记录。蔡玉婷表示,这也是业内首次在输入法中加入声纹识别。
AR表情
百度输入法8.0的另外一大功能是加入了AR表情,蔡玉婷表示,百度输入法中有70%是90后,其中60%的人经常玩斗图。用户不仅可根据相机或相册进行人脸识别、制作表情包,还支持用户通过自己的表情控制虚拟人物形象。制作出来的AR表情,可以直接通过输入法搜索、语音输入和键盘输入时展示出来。
AR表情功能
百度输入法与中国非物质文化遗产“桃花坞年画”合作,加入了很多中国传统人物表情。现场,百度输入法工程师演示了多种表情,百度输入法可以自动生成与用户一致的表情包。(小羿)
关注网易智能公众号(smartman163),获取人工智能行业最新报告。