Nov, 2023

开源LLM指令调整的自动指令优化

TL;DR通过自动修订样本来增强指令数据集的质量,CoachLM训练自人工专家修订过的样本,并将数据集中高质量样本的比例从17.7%提高到78.9%。CoachLM通过平均29.9%的提升改善了指令调优的语言学习模型的指令跟随能力,并在华为的LLM数据管理系统中实现了高达20%的效率提升。