Feb, 2024

抓住机遇:硬样本重新加权的连续训练提高 LLM 的推广能力

TL;DR使用实例重新加权的分布鲁棒优化方法在大型语言模型的持续训练中有效地优化了样本保留,提高了语言模型的性能。