Nov, 2024

学习动态揭示大型语言模型推理中的泛化机制

TL;DR本研究探讨了大型语言模型(LLM)微调过程中学习动态对后续泛化的影响,特别是在推理任务中。通过引入“预记忆训练准确度”这一训练指标,本文表明该指标能有效预测测试准确度并指导数据选择,从而在数据效率上实现显著提升。