ICLRMar, 2023

通过参数有效的迁移学习对视觉到语言的对比对齐

TL;DR本文探讨了通过转移学习和最小更新已经训练好的视觉模型和语言模型创建对比视觉 - 语言模型的效率和性能,发现在少量参数更新(<7%)的情况下即可达到全模型训练的性能,而在更新特定组件(<1% 的参数)的情况下,也可以达到 75% 的全模型训练性能。