Oct, 2022
一个基准重新审视:推动多段落模型在上下文感知翻译中的极限
A baseline revisited: Pushing the limits of multi-segment models for context-aware translation
Suvodeep Majumder, Stanislas Lauly, Maria Nadejde, Marcello Federico, Georgiana Dinu
TL;DR利用多段模型进行上下文翻译,在不需要额外的语言特定调整和特定任务结构的情况下,通过增加模型容量并使用知识蒸馏技术,取得了可比较的性能,更适合捕获上下文依赖关系。