Jun, 2024

通过传导提升视觉语言模型

TL;DRTransCLIP 是一种新颖且计算效率高的跨模态转导方法,通过集成文本编码知识和引导转导学习过程的 KL 散度惩罚来改善感知模型的性能。