Mar, 2024

COIG-CQIA:中文指导微调只需一切皆优质

TL;DR近年来,大型语言模型在英语方面取得了显著进展,但在中文指令调整方面仍存在差距。为了缩小这一差距,本研究介绍了 COIG-CQIA,一个高质量的中文指令调整数据集,并通过训练模型和深度评估分析,提供了有关选择和开发中文指令调整数据集的宝贵见解。研究表明,在 CQIA-Subset 上训练的模型在人员评估以及知识和安全基准方面取得了有竞争力的结果。