Aug, 2023

语言知识能够改善视觉 - 语言预训练中的多模态对齐吗?

TL;DR研究探讨了多模态预训练神经网络模型在视觉语言相关方面的影响,设计并发布了 SNARE 多模态对齐基准,分析了五种先进的视觉语言模型的综合性能。