Feb, 2024

LESS: 选择影响力数据以进行目标指导优化

TL;DR我们提出了 LESS,这是一种优化感知且实际高效的算法,用于有效估计数据影响并执行用于指令数据选择的低秩梯度相似性搜索。实验表明,在多样的下游任务中,使用 LESS 选中的 5% 的数据进行训练通常优于全数据集的训练。此外,所选数据具有高度可迁移性:可以利用较小的模型为较大的模型以及来自不同家族的模型选择有用的数据。我们的定性分析表明,我们的方法超越了表面形式线索,能够识别出在预期的下游应用中体现必要推理技能的数据。