BriefGPT.xyz
Feb, 2025
令牌清理:针对大型语言模型监督微调的精细数据选择
Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning
HTML
PDF
Jinlong Pang, Na Di, Zhaowei Zhu, Jiaheng Wei, Hao Cheng...
TL;DR
本文针对大型语言模型(LLM)监督微调中的数据质量问题,提出了一种新的令牌清理方法,以过滤无信息的令牌,保留关键的任务相关信息。研究发现,通过分析模型更新对每个令牌的影响,可以有效提升模型在下游任务中的表现,证明了我们的框架在多个任务中均有显著改善。
Abstract
Recent studies show that in
Supervised Fine-Tuning
(SFT) of
Large Language Models
(LLMs), data quality matters more than quantity. While most
Dat
→