Feb, 2024
调查多语言指令调整:多语模型是否需要多语言指令?
Investigating Multilingual Instruction-Tuning: Do Polyglot Models Demand
for Multilingual Instructions?
TL;DR通过对多种印欧语言中的大规模语言模型进行多语言指令调整数据集上的广泛研究,我们发现使用平行指令调整数据集相比单语数据集能提高跨语言指令遵循能力,还发现大规模指令调整数据集对于多语言7B参数模型至关重要,并进行人工注释研究以理解多语言聊天场景中基于人类和GPT-4的评价之间的对齐情况。