ACLApr, 2017

语音解析:一种神经方法用于集成词汇和声学 - 韵律信息

TL;DR本文中,我们提出了一个模型,该模型使用卷积神经网络对能量和音高轨迹进行耦合,并使用基于注意力机制的循环神经网络,接受文本和韵律特征,并结合转录文本和声学 - 韵律特征,以自动解析口语话语,并发现不同类型的声学 - 韵律特征都有助于解析,对比一个强文本基线,该模型取得了显著的改进。错误分析表明,声学 - 韵律特征的主要优点在于有误流畅度的句子,附加决策得到最大的改进,文本转录错误掩盖了音韵的改进。