关于缺失模态的深度多模态学习的综合调查
本文研究多模态学习中缺失模态的问题,提出一种基于贝叶斯元学习的方法SMIL,可同时实现训练及测试数据中缺失模态的灵活性及训练数据大量缺失模态时的高效性,实验证明SMIL方法在MM-IMDb、CMU-MOSI和avMNIST三个数据集上的性能均优于现有方法和生成基线,代码可从链接获取。
Mar, 2021
本文提出一种使用prompt learning的多模态学习框架,从而解决真实世界中遇到的模态缺失和模型训练资源需要的挑战。框架中含有modality-missing-aware prompts,可插入到多模态transformers中处理不同的模态缺失情况,同时只需要少于1%的可学习参数。实验结果表明,该框架有效地提高了在各种模态缺失情况下的性能。
Mar, 2023
多模态学习中处理缺失模态的信息论方法,通过引入Uni-Modal Ensemble with Missing Modality Adaptation技术,实现了对非缺失模态的特征提取和融合过程中的噪声鲁棒性增强,适用于广泛的模态并可无缝集成大规模预训练编码器,展示了在音频-视觉数据集和视觉-语言数据集上的有效性。
Oct, 2023
综合利用预训练模型参数高效微调和自监督联合嵌入学习方法,本文提出了一种解决多模态学习中缺失模态问题的新框架,通过利用可用模态的信息,该框架使模型能够在推理期间在表示空间中预测缺失模态的嵌入,在多个多模态基准数据集上评估方法,展示了它在各种缺失模态的情景中的有效性和鲁棒性。
Jul, 2024
本研究解决了现有多模态网络在处理缺失模态时性能下降的问题。提出的模态不变多模态学习方法采用单分支网络,能够共享权重以学习模态间表示,从而提高对缺失模态的鲁棒性。实验结果表明,该方法在所有模态均存在的情况下及缺失模态的情况下均优于现有最先进的方法。
Aug, 2024
本研究解决了在多模态模型训练和推理过程中,由于缺失模态而导致模型性能下降的问题。通过全面回顾深度学习技术在缺失模态多模态学习(MLMM)中的应用,论文阐明了MLMM与标准多模态学习的区别,分析了当前的方法和挑战,揭示了该领域的未来发展方向。
Sep, 2024