BriefGPT.xyz
Ask
alpha
关键词
adaptive self-distillation mechanism
搜索结果 - 1
ICLR
克服视觉语言模型微调的问题:针对 OOD 泛化
在本论文中,我们首先展示了,经过足够时间的微调但没有适当的正则化,视觉 - 语言模型在给定数据集中往往会过度拟合已知类别,导致对未知类别的表现下降。然后,我们提出了一种新颖的方法 OGEN 来解决这个问题,在关注点主要是改进经过微调模型的未
→
PDF
5 months ago
Prev
Next