Nov, 2024
DELIFT:数据高效的语言模型指令微调
DELIFT: Data Efficient Language model Instruction Fine Tuning
TL;DR本研究针对大型语言模型微调中的数据冗余和无信息问题,提出了一种新的算法DELIFT,通过在指令调优、任务特定微调和持续微调三个关键阶段系统优化数据选择,显著提高了数据利用效率。实验表明,DELIFT能够在不降低模型性能的情况下,将微调数据量减少多达70%,从而实现显著的计算节约并在效率和效果上超越现有方法。