May, 2022

AppTek 提交给 IWSLT 2022 同构口语语言翻译任务

TL;DRAppTek 使用基于神经 Transformer 的系统对英语到德语的音–语翻译任务进行了改进,通过使用源端伪标记、目标端伪标记和使用剩余字符长度编码来实现长度控制,同时使用由 MuST-C 原始语料库派生的合成数据,使翻译满足长度条件,研究结果表明,可以在最小化 BERT 和 BLEU 分数损失的同时实现超过 90%的长度符合度。