May, 2023
通过使用翻译指示进行多语言微调,引发大型语言模型的翻译能力
Eliciting the Translation Ability of Large Language Models via
Multilingual Finetuning with Translation Instructions
TL;DR本篇论文通过对一个多语种预训练语言模型XGLM-7B进行微调并给出指示进行多语种翻译的实验,展示了预训练语言模型在翻译任务中的较强能力,并发现其翻译能力依赖于对翻译指令的理解和语言之间的对齐,研究结果可启发模型改进。