Oct, 2023

大型语言模型的能力受监督微调数据组成的影响

TL;DR通过研究大型语言模型在数据组成、数学推理、代码生成和精细调整策略等方面的能力,发现不同能力展现出不同的扩展模式,较大的模型在相同数据量下表现更好;数据组成在低数据量下会改善各种能力,而在高数据量下可能导致能力冲突;而我们提出的双阶段混合精细调整策略能够解决多个能力的学习问题。