Mar, 2022

语音识别中的相似性和基于内容的音素自注意力机制

TL;DR通过提出改进的语音注意力模型,即基于相似性和基于内容两种不同类型语音自注意力模型,本研究通过简单修改增强了模型对语音特征的提取能力,从而在低层替换自我注意力结构后,提高了语音识别性能而不增加延迟和参数大小。