Oct, 2024
语言学启发的多语言指令调优:是否存在最佳的语言选择?
Linguistically-Informed Multilingual Instruction Tuning: Is There an
Optimal Set of Languages to Tune?
TL;DR本研究解决了多语言模型在不同语言间表现不均的问题,特别是由于传统调优方法的高计算成本和数据质量不足。我们提出了一种基于语言特征选择语言的调优方法,实验结果表明这种选择方式比随机选择语言更能提升模型在多任务中的表现,对多语言系统的开发和数据集创建具有重要影响。