Apr, 2020

流式序列到序列语音识别的最小延迟训练策略

TL;DR本文研究在线语音识别中的延迟问题,探究了利用硬对齐来进行多任务学习、预训练、合理删减对齐路径和直接减少预期延迟损失等多项方案,成功地实现了对延迟的缩减,并在某些情况下提高了语音识别准确性。