2月21日,由网易科技和DeepTech深科技联合主办的《麻省理工科技评论》2017年“全球十大突破技术”发布会在北京举办。本次大会立足技术趋势,探索全球技术发展的内在原动力,探讨人工智能、量子计算、基因疗法等领域的技术和商业趋势。
科大讯飞研究院院长胡国平,人工智能“强化学习”圆桌环节发言表示,强化学习从大的角度来说和深度学习有相似之处,最准确的、比较成功的说法,应该叫深度强化学习,或者强化深度学习,核心概念是要用深度学习,包括AlphaGO,都要用深度学习的方式,去提取在这样的复杂状态下,应该采取什么样的动作。
以下为现场速记实录:
主持人(石岚): 我们都知道科大讯飞,凡是我去合肥,提到合肥创业最成功的企业,这个名字是一定会提到的。所以,在语音识别技术,在全球也都非常有影响力。
给您的问题是:强化学习在语音识别技术中的应用,机器自主学习能力是否有助于语音识别中“鸡尾酒会”,以及提升自然语言处理能力?
胡国平:过去这几年,深度学习在整个人工智能,特别是语音识别、图像识别领域取得了重大突破。
它核心的一条是,利用了深度学习和大数据这样一个技术,使得能够构建出非常复杂和强大的网络建模,保证了语音识别的正确率。
关于鸡尾酒效应,它从技术角度其实不是一个强化学习的概念,它还是单次的决策,当前的数字信号进来会有什么样的输出结果。
所以,现在对于讯飞来说,更多用的是其它技术,包括麦克风阵列的技术,包括在神经网络的构建中,如何能够有效的区分,哪部分是语音、哪部分是噪声的技术,有效分离,来实现在噪声环境下,包括在鸡尾酒效应下的这样一些语音识别的问题。
确实,现在语音识别在噪声环境下的识别率,已经跟近讲识别率,已经达到接近的水平。
当您刚才提到的另外一个倒是很正确的概念,就是在自然语言理解,特别是在自然语言对话方面,它也会涉及到当前的对话状态和在当前对话状态下,下一步应该采取什么样的对话动作,或者方式,去做出选择。而这,其实就是强化学习的概念。
强化学习,大的角度来说,它和深度学习,其实现在最准确的、比较成功的说法,应该叫深度强化学习,或者强化深度学习。它的核心概念,其实还是要用深度学习,包括AlphaGO,都要用深度学习的方式,去提取在这样的复杂状态下,应该采取什么样的动作一些关键特征。
在我们的对话系统里面,也会涉及到在当前的复杂状态下,包括机器和用户之间的对话,包括我们的客服系统里有的后台支持复杂状态下,对于机器而言,应该采取什么样更有效的动作,或者问法、回答,能够让整个对话进行的更加顺利。
所以总体来说,我们把强化学习更多用在对话和客服方面来做。
主持人(石岚):谢谢胡院长!