BriefGPT.xyz
大模型
Ask
alpha
关键词
generalization robustness
搜索结果 - 2
FTFT:高效稳健的微调算法 —— 通过迁移训练动态
通过数据映射方法和引入训练动态的方式,本文提出一种新的微调方法(FTFT),相比传统的经验风险最小化方法(ERM),该方法在训练成本减半的情况下达到更好的泛化鲁棒性。
PDF
9 months ago
ICCV
跨范数和自范数:在分布偏移下的泛化
本文介绍了新的标准化技术 ——CrossNorm 和 SelfNorm,通过交换特征图之间的通道均值和方差以及使用注意力重新校准统计量来改善在 distribution shifts 下的泛化鲁棒性,证明了其在不同领域(视觉和语言),任务(
→
PDF
3 years ago
Prev
Next