多交互特征学习和全时多模态图像融合与分割基准
在本文中,我们提出了一种多模态图像融合(MMIF)框架,旨在解决多个可见光图像与红外图像的焦点区域不同的融合问题。通过引入半稀疏平滑滤波器对图像进行分解为结构和纹理成分,并提出了一种新的多尺度操作器对纹理成分进行融合。同时,我们考虑结构成分中能量信息的分布,以实现场景亮度的有效捕捉和合理的对比度维持。实验结果表明,该算法在视觉感知和数量化评估方面均优于现有的方法。
Nov, 2023
本文描述了一种层次双任务驱动的深度模型,用于多模态场景感知,包括图像融合和场景理解。该模型不仅能够产生视觉良好的融合结果,而且比现有技术实现了显著的检测和分割优势。
May, 2023
通过引入创新的多模态信息交叉变换器(MicFormer),本研究在多模态图像任务中成功整合不同模态之间的相关信息,显著提高了分割性能,表明 MicFormer 在多模态图像任务中具有广泛的应用潜力。
Apr, 2024
本文提出了一种高效的 CNN 方法 ——MSFNet,它利用类边界监督和多特征融合模块来实现实时语义分割,并在 Cityscapes 和 Camvid 数据集上得到了比现有方法更好的结果。
Nov, 2019
利用多模态数据的几何和语义特征,通过三个步骤来完成多模态 3D 语义分割任务。经过我们的研究,MSeg3D 在 nuScenes、Waymo 和 SemanticKITTI 数据集上取得了最先进的结果。
Mar, 2023
提出了一种自适应动态融合多模态语义分割框架,采用自监督模型的融合机制来优化融合多模态特征,在物体类别、空间位置和场景上下文方面增强鲁棒性,同时提出了一种计算高效的 AdapNet ++ 单模分割体系结构,并获得了最新的性能。
Aug, 2018
基于双模性策略的先验语义引导图像融合方法提供了在智能交通系统中提高红外和可见光图像融合性能的新途径,通过设计并应用两个并行的语义分割支路和一种自适应调制机制,捕捉和整合了两个图像的重要的先验语义信息,并通过多级表示自适应融合模块进一步整合高层语义和细节,优于现有图像融合方法。
Mar, 2024
本文提出了在监督医学图像分析中进行图像融合方案的概念架构,实现了基于卷积神经网络的三种图像融合方案,并将其结合成单个框架,用于同时分析多模式图像,检测软组织肉瘤的存在,并发现在特征级别融合的情况下,性能最好,但当任何图像模式存在大误差时,其鲁棒性会降低。
Oct, 2017
提出 MMF-Track,一种多模态多级融合跟踪器,利用点云的几何和图像纹理特征跟踪 3D 目标,在 KITTI 上实现了最先进的性能表现,并在 NuScenes 上具有竞争力。
May, 2023
本篇论文提出了一种基于 Transformer 的多模态相互注意力机制和相互解码器,与之相结合的迭代式多模态交互机制及语言特征重建技术,在指代图像分割的任务中取得了很好的效果。
May, 2023