Apr, 2025
指令和推理数据如何塑造后期训练:通过层级梯度透视数据质量
How Instruction and Reasoning Data shape Post-Training: Data Quality
through the Lens of Layer-wise Gradients
TL;DR本研究探讨了不同质量的数据如何影响大语言模型的后期训练动态,填补了这一领域的研究空白。通过层级梯度的光谱分析,发现高质量的数据通常与更低的核范数和更高的有效秩相关。此外,本研究表明推理数据在复杂任务中展示出显著更高的有效秩,揭示了数据质量与训练稳定性之间的相互影响。