Jul, 2022

基于句间注意力机制改进基于 Transformer 的对话语音识别

TL;DR本文提出了一种基于Transformer的端到端架构方法,在自动语音识别中精确建模跨话语的语境依赖,通过引入上下文感知残余注意机制,对先前语音的上下文进行编码,同时,还采用条件解码器框架将历史语言信息融入到当前预测中,结果表明该方法在几种公开对话语料库上都取得了持续的改进