半监督多模式语义分割中的缺失模态稳健性
我们介绍了 U3M:一种用于多模态语义分割的无偏多尺度模态融合模型,其通过有效提取和整合全局和局部特征,实现了在多个数据集上的优越性能,并证实了在各种环境中增强语义分割的鲁棒性和多样性。
May, 2024
提出了一种自适应动态融合多模态语义分割框架,采用自监督模型的融合机制来优化融合多模态特征,在物体类别、空间位置和场景上下文方面增强鲁棒性,同时提出了一种计算高效的 AdapNet ++ 单模分割体系结构,并获得了最新的性能。
Aug, 2018
提出了一种简单而有效的框架 TRML,即利用多模态基础模型进行鲁棒多模态学习,通过生成虚拟模态替代丢失模态,并对生成和丢失模态之间的语义空间进行对齐,从而捕捉缺失模态的语义。在完整模态的情况下,我们的模型通过利用交叉模态语义空间的对齐来捕捉丢失模态的语义。实验证明我们的方法在三个多模态情感分析基准数据集 CMU-MOSI、CMU-MOSEI 和 MELD 上具有优势。
Jan, 2024
提出了一种具有模态重建和模型个性化的健壮的通用模型,能够在训练和测试阶段有效地处理缺失的模态,通过多模态掩码自编码器重构缺失的模态和掩码补丁,利用创新的分布近似机制充分利用完整和不完整的数据,提出了基于 CLIP 的超网络来个性化模型参数,能够适应不同的缺失模态场景,并在两个脑肿瘤分割基准上得到广泛验证,在不同缺失比例的全阶段缺失模态设置下始终超过先前最先进的方法,代码将可用。
Jun, 2024
利用多模态数据的几何和语义特征,通过三个步骤来完成多模态 3D 语义分割任务。经过我们的研究,MSeg3D 在 nuScenes、Waymo 和 SemanticKITTI 数据集上取得了最先进的结果。
Mar, 2023
通过引入原型库到基于 FedAvg 的联邦学习框架,提出了一种解决模态缺失问题的方法,利用原型作为缺失模态的掩码来构建任务校准的训练损失和模型不可知的单模态推断策略,实验证明该方法在推断准确性方面达到了最先进水平。
Dec, 2023
本研究旨在开发一种对医疗数据具有鲁棒性的高效多模态融合架构,并进一步提高疾病诊断的性能。实验证明,我们提出的多模态融合架构有效地融合了三种模态并对缺失模态表现出较强的鲁棒性。该方法有望扩展到更多模态以增强模型的临床实用性。
Sep, 2023
利用多模态融合可以使语义分割更具鲁棒性,但是融合任意数量的模态仍未被探索,因此我们创建了 DelIVER 任意模态分割基准,并提供了四种恶劣天气条件和五种传感器故障情况的数据集,以利用模态互补性和解决局部故障。我们提出了交叉模态分割模型 CMNeXt,它包含一个自查询中心设计来从任何模态中提取有效信息,并添加每增加一个模态只有可以忽略的参数量。在多项基准测试中,我们的方法在 DelIVER,KITTI-360,MFNet,NYU Depth V2,UrbanLF 和 MCubeS 数据集上均取得了最先进的性能。
Mar, 2023
本文针对多模态动作识别及其中一些模态不可用情况提出一套良好的实践方法,包括数据增强、基于 Transformer 的融合方法以及一个名为 ActionMAE 的模块化网络。通过采用这些方法,建立一个不仅在多模态动作识别中有效,同时对于模态缺失情况也具有鲁棒性的模型,并在多个基准测试中实现了最新技术,并在模态缺失场景中保持有竞争力的表现。
Nov, 2022