Apr, 2024

Conifer: 提高大型语言模型复杂约束指令遵循能力

TL;DR通过引入名为Conifer的新型指令调整数据集,以及采用渐进学习方案和学习过程反馈,我们提高了大型语言模型(LLMs)在遵循具有复杂约束的多级指令方面的能力,并在几个指令遵循基准测试中,实现了与现有7B模型相比的显著改进,甚至在某些度量标准上超过了10倍大的模型的性能。