Feb, 2024

逐步推进零尾到尾语音翻译的极限

TL;DR该论文介绍了一种名为 ZeroSwot 的零样本语音翻译方法,通过利用新颖的 CTC 压缩和最优传输技术,在没有配对的语音翻译数据的情况下,通过仅使用语音识别数据训练语音编码器,实现了语音到文本的直接翻译,展示了该方法在模态差异上的优越性和超越之前的零样本模型以及有监督模型的实验结果,达到了最先进的效果。