BriefGPT.xyz
Oct, 2019
低资源语音识别预训练的分析
Analyzing ASR pretraining for low-resource speech-to-text translation
HTML
PDF
Mihaela C. Stoian, Sameer Bansal, Sharon Goldwater
TL;DR
本文探讨了如何提高低资源语言的自动语音翻译质量,研究表明在高资源语言上训练端到端自动语音识别模型可以有效提高自动语音译文质量,作者发现最终自动语音译文质量的最佳预测因素是预训练的ASR模型的词错误率,并且研究发现预训练和数据增强对AST翻译质量的提高是互补的。
Abstract
Previous work has shown that for low-resource source languages,
automatic speech-to-text translation
(AST) can be improved by
pretraining
an
end-
→