May, 2023

强健的跨语言转移:通过模型检查点平均化实现免费午餐

TL;DR本文探讨了在跨语种任务上,fine-tuning 的模型在模型点上的性能评估并不符合 zero-shot 和 few-shot 学习的前提;并提出了一种更为稳健的模型检查点平均方法,特别是在没有标注的目标语言数据的情况下,该方法在多个任务和语种下表现出可靠的性能。