基于低质量数据的多模态融合面临四个主要挑战:噪声多模态数据,不完整多模态数据,不平衡多模态数据和质量变化多模态数据。本文通过全面的分类对多模态融合的常见挑战和最新进展进行调研,为研究人员提供了了解该领域现状和发现潜在研究方向的方法。此外,本文还讨论了该领域的开放问题以及有趣的未来研究方向。
Apr, 2024
提出了一种用于多模态学习的预测动态融合(PDF)框架,通过从泛化角度揭示多模态融合,理论上推导出可预测的合作信念(Co-Belief)与单一和整体置信的关系,并进一步提出相对校准策略以校准潜在的不确定性,通过在多个基准测试上的大量实验证实了其优越性。
Jun, 2024
本文提出了一种动态多模态融合的方法,可以在预测过程中根据数据的不同需求自适应地融合多模态数据,从而有效地减少计算成本,并在多个多模态任务上获得了良好的效果,这为动态多模态网络设计开辟了一条新的方向。
Mar, 2022
本研究提出了两种自适应融合网络(Auto-Fusion、GAN-Fusion),通过对不同模态的特征进行有效的上下文建模,在多模态机器翻译和情感识别等任务中取得了比现有方法更好的效果。
Nov, 2019
本文提出了一种通过寻求动态多模式融合过程的固定点并以适应性和递归的方式建模特征相关性的新型深度平衡(DEQ)方法,从低级到高级彻底编码了跨模态信息,取得了多个多模态基准的最先进性能。
Jun, 2023
本文证明了使用多种模态进行深度学习相比于使用单一模态,采用常见的多模态融合框架可以更好地学习,并且能够获得较小的总体风险,这是首个从泛化角度捕捉到真实多模态应用中重要的定性现象的理论论证。
Jun, 2021
本研究提出了三种新颖的动态融合方法,旨在根据不同类型的词动态地融合来自不同模式的语义表示,并在单模型和多模型情况下取得了优于现有方法的成果。
Jan, 2018
探究了目前多模态融合模型是否利用补充信息来防御对抗攻击,通过在 MFNet 上应用 FGSM 和 PGD 等对抗攻击进行实验验证,发现多模态融合模型在对抗攻击方面仍然存在脆弱性。
May, 2020
研究了如何通过人工注释对多模态交互进行分类,提出了信息分解方法,比较了部分标签和反事实标签的机会和限制,并提出了一种自动转换方法以量化多模态数据集中的交互
本文介绍了一种使用低秩张量完成多模态数据融合的新方法,并在多模态情感分析、演讲者特征和情感识别等多个任务中取得了有竞争力的结果且极大地减少了计算复杂度。
May, 2018