ACLSep, 2021

学习何时为流式语音进行翻译

TL;DR本文提出了 MoSST 方法,一种用于流式语音翻译的简单有效方法,通过在编码器 - 解码器模型中构建高效的单调分割模块来逐步累积声学信息并检测输入语音中的适当语音单元边界。实验表明,MoSST 在 MuST-C 数据集的多个翻译方向上表现优异,实现了翻译质量和延迟之间的最佳折衷。