Oct, 2022

一个基准重新审视:推动多段落模型在上下文感知翻译中的极限

TL;DR利用多段模型进行上下文翻译,在不需要额外的语言特定调整和特定任务结构的情况下,通过增加模型容量并使用知识蒸馏技术,取得了可比较的性能,更适合捕获上下文依赖关系。