Apr, 2020
流式序列到序列语音识别的最小延迟训练策略
Minimum Latency Training Strategies for Streaming Sequence-to-Sequence ASR
Hirofumi Inaguma, Yashesh Gaur, Liang Lu, Jinyu Li, Yifan Gong
TL;DR本文研究在线语音识别中的延迟问题,探究了利用硬对齐来进行多任务学习、预训练、合理删减对齐路径和直接减少预期延迟损失等多项方案,成功地实现了对延迟的缩减,并在某些情况下提高了语音识别准确性。