May, 2023

通过相关最大化和最小化实现多模态理解

TL;DR使用 Multimodal Understanding Through Correlation Maximization and Minimization(MUCMM) 框架,该框架可以轻松地嵌入到任何预训练网络中,学习模态数据的常见和个体表示,根据提出的方法,通过可视化分析过程给出了 MUCMM 学习结构化潜在表示的解释。