BriefGPT.xyz
大模型
Ask
alpha
关键词
instance-reweighted distributionally robust optimization
搜索结果 - 1
抓住机遇:硬样本重新加权的连续训练提高 LLM 的推广能力
使用实例重新加权的分布鲁棒优化方法在大型语言模型的持续训练中有效地优化了样本保留,提高了语言模型的性能。
PDF
4 months ago
Prev
Next