Aug, 2022
语言标记:一种令人沮丧的简单方法提高多语言翻译的零射击性能
Language Tokens: A Frustratingly Simple Approach Improves Zero-Shot Performance of Multilingual Translation
Muhammad ElNokrashy, Amr Hendy, Mohamed Maher, Mohamed Afify, Hany Hassan Awadalla
TL;DR本研究提出使用编码器 - 解码器框架来处理机器翻译的问题,在零样本情况和有直接数据的情况下,对输入记号进行修改并在编码器和解码器中包含源和目标语言的信号以提高性能,通过基于预训练模型或从头开始训练模型并使用所提出的设置从实验中得出改进结果,得出在内部数据集和 WMT 评估中模型表现的数字结果.