BriefGPT.xyz
大模型
Ask
alpha
关键词
gift approach
搜索结果 - 1
GIFT:在接近零成本的缩减数据集中挖掘标签的全部潜力
近期关于数据集蒸馏的研究表明,采用预训练教师模型生成的软标签具有显著优势。本文从一个新的角度强调标签的充分利用。我们首先对用于数据集蒸馏的软标签利用的各种损失函数进行了全面比较,发现在合成数据集上训练的模型对于损失函数的选择具有很高的敏感性
→
PDF
a month ago
Prev
Next