Oct, 2023

面对缺失模态问题,如何打造强大的多模态模型?

TL;DR多模态学习中处理缺失模态的信息论方法,通过引入 Uni-Modal Ensemble with Missing Modality Adaptation 技术,实现了对非缺失模态的特征提取和融合过程中的噪声鲁棒性增强,适用于广泛的模态并可无缝集成大规模预训练编码器,展示了在音频 - 视觉数据集和视觉 - 语言数据集上的有效性。