ICLRMay, 2024

從原則出發的數據選擇,為 LLMs 的預熱微調提供更多、花費更少

TL;DR使用无标签开放数据进行预精调预训练语言模型以最小化领域特定数据需求,并在达到预期性能水平的同时选择数据以将预训练分布推向目标分布的优化方法,展示了该方法在各种任务中的优越性和快速性,为经济高效的微调奠定了基础。