Oct, 2019
多语言端到端语音翻译
Multilingual End-to-End Speech Translation
Hirofumi Inaguma, Kevin Duh, Tatsuya Kawahara, Shinji Watanabe
TL;DR本文提出了一种简单且有效的多语言端到端语音翻译框架,并证明了其在自动语音识别、机器翻译、一对多翻译以及多对多翻译中的有效性以及相对于双语端到端语音翻译的优势。
Abstract
In this paper, we propose a simple yet effective framework for multilingual
end-to-end speech translation (ST), in which speech utterances in source
languages are directly translated to the desired target languages with a
universal sequence-to-sequence architecture. While multilingual models have
shown to be useful for →
multilingual end-to-end speech translationautomatic speech recognitionmachine translationone-to-many translationsmany-to-many translations
发现论文,激发创造
多语言一对多端到端语音翻译
本文旨在通过使用多语言方法探究转移学习在以端到端神经模型进行口语翻译中的有效性,结果表明,使用目标语言嵌入语义空间可以更有效地区分不同目标语言并改进结果,其中当对相似语言进行翻译时效果更为显著,特别是数据不足的情况下。
Oct, 2019
知识蒸馏技术下的端到端语音翻译
本文提出了一种基于知识蒸馏的方法来提高端到端语音翻译 (ST) 模型的性能,通过从文本翻译模型中转移知识来训练 ST 模型。在英法增广 LibriSpeech 和英汉 TED 语料库上的实验结果表明,使用该方法可以对相似和不相似的语言对进行端到端 ST 实现,并且在老师模型的指导下,端到端 ST 模型可以取得 3.5 个 BLEU 分数的显着提升。
Apr, 2019
无监督语音文本翻译
本文提出了一种基于单语音频和文本语料库的语音翻译系统框架,使用交叉模态双语词典将每个源语音片段对应到目标文本翻译,通过使用语言模型和序列去噪自编码器,对每个音频片段进行逐字翻译来提高翻译质量,实验结果表明,我们的无监督系统尽管没有监督,但达到了与监督方法相比可比的 BLEU 分数。
Nov, 2018
联合语音识别和翻译的流式模型
本文介绍了如何使用端到端模型进行语音翻译,并在流式翻译设置中实现同时生成音频转录和翻译输出,并比较了与标准级联方法的表现,结果表明这种方法与级联模型的表现相似,但参数数量更少。
Jan, 2021
利用弱监督数据提高端到端的语音到文本翻译
本文探讨了使用预训练的机器翻译或文本到语音合成模型将弱监督数据转化为语音到翻译对对于 ST 的训练比多任务学习效果更好的问题,展示了只使用弱监督数据即可以获得高质量的终到端 ST 模型,并讨论了避免模型对合成的语音过度拟合的方法。
Nov, 2018