Jun, 2024

通过合成音频数据进行端到端低资源语音翻译

TL;DR我们在国际口语翻译会议 (IWSLT 2024) 上描述了我们的系统提交,用于爱尔兰 - 英语语音翻译。我们基于 Whisper 构建了端到端系统,并采用了一些数据增强技术,如语音回译和噪声增强。我们研究了使用合成音频数据的影响,并讨论了几种丰富信号多样性的方法。