Feb, 2025

令牌清理:针对大型语言模型监督微调的精细数据选择

TL;DR本文针对大型语言模型(LLM)监督微调中的数据质量问题,提出了一种新的令牌清理方法,以过滤无信息的令牌,保留关键的任务相关信息。研究发现,通过分析模型更新对每个令牌的影响,可以有效提升模型在下游任务中的表现,证明了我们的框架在多个任务中均有显著改善。