Feb, 2024

指导多样性推动对未知任务的泛化

TL;DR通过调整指令,大型语言模型(LLM)可以进行微调,实现真实世界任务执行和遵循人类指令;实现普遍使用的关键取决于模型学习更广泛的指令集而不仅仅是训练集上的指令。本文通过实验探究了指令多样性与模型普适性之间的权衡,发现多样性的指令集使模型具备普适性,并确保在训练集上非均匀分布指令的情况下保持鲁棒性。