May, 2024
多模态学习框架:联合建模跨模态和同模态依赖关系
A Framework for Multi-modal Learning: Jointly Modeling Inter- & Intra-Modality Dependencies
Divyam Madaan, Taro Makino, Sumit Chopra, Kyunghyun Cho
TL;DR通过提出的 I2M2 框架,我们捕捉并整合了模态间和模态内的依赖关系,从而实现了更精确的预测。在真实世界的医疗和视觉与语言数据集上,我们使用最先进的模型评估了我们的方法,并且表现出优于传统方法的性能,传统方法仅关注一种模态依赖。