Jul, 2021

USTC-NELSLIP 在 IWSLT 2021 的同声传译系统

TL;DR本文介绍了中国科技大学 - 智能语音处理研究组在 IWSLT2021 同声传译(Simultaneous Speech Translation)比赛中的参赛作品。我们提出了一种新颖的同声翻译模型 Cross Attention Augmented Transducer(CAAT),该模型可以在没有单调性约束的情况下进行序列到序列任务,例如同时翻译。我们在语音到文本(S2T)和文本到文本(T2T)同时翻译任务上进行实验,结果显示 CAAT 相对于之前的最先进方法之一 wait-k 实现了更好的质量 - 延迟权衡。基于 CAAT 架构和数据增强,我们在这次评估活动中构建 S2T 和 T2T 同时翻译系统,相比去年的最佳系统,我们的 S2T 同时翻译系统平均提高了 11.3 BLEU,而我们的 T2T 同时翻译系统平均提高了 4.6 BLEU。