区域互信息损失在语义分割中的应用
本文提出了一种全新的完全无监督语义分割方法,名为 InMARS,以信息最大化和对抗性正则化分割为基础,并结合对抗性训练策略,通过像人类感知一样先将输入图像分区,然后将其聚类为语义上有意义的类别,其实验结果表明在两个常用的无监督语义分割数据集上,InMARS 方法取得了最先进的性能。
Jul, 2021
本文提出了基于区域级别对比和一致性学习框架 (RC^2L) 的半监督语义分割方法,通过引入区域级别损失,包括 Region Mask Contrastive (RMC) 损失、Region Feature Contrastive (RFC) 损失、Region Class Consistency (RCC) 损失和 Semantic Mask Consistency (SMC) 损失,实现了更好的稳定性和性能。在 PASCAL VOC 2012 和 Cityscapes 数据集上的实验结果表明,所提出的方法优于现有最先进方法。
Apr, 2022
本文提出了一种基于自监督学习的无监督语义图像分割的新方法,通过局部和全局高级别图像特征间的互信息最大化计算多个高级别特征,实现对不同语义类别的图像分割和互信息最大化的两阶段学习过程,并在已有数据集和引入的 COCO-Persons 数据集上相对推进了 26%(基于像素准确率评估)。
Oct, 2021
本研究提出了 Spatial Semantic Recurrent Mining (S extsuperscript {2} RM) 方法,用于实现高质量的跨模态融合,包括分布语言特征、空间语义递归协同解析和解析语义平衡,并结合 Cross-scale Abstract Semantic Guided Decoder (CASG) 来凸显指代物的前景。实验证明,该方法在四个具有挑战性的数据集上表现优于其他先进算法。
May, 2024
基于视觉基于模型,提出了一种关系感知的单模态匹配 (OVS) 框架,用于解决像素分组和区域识别方法中图像特征与类别标签之间的误匹配问题,并在三个基准测试中展现出大幅度优势。
Mar, 2024
通过将协同推断原理与信息理论测量相集成,我们的研究在多模态框架内实现了轻量级、无蒙特卡罗的不确定性估计,并通过多元高斯变分自动编码器的潜变量的乘积来融合 RGB 摄像机和 LiDAR 传感器数据的特征以提高预测准确性。通过基于加权损失函数的 CI 得出的不确定性边界的标准化互信息被用作调制器。我们的仿真结果表明,在模型训练期间,内在的预测不确定性与 NMI 呈负相关。该框架在 KITTI 3D 物体检测基准上展示了与不具备不确定性感知能力的相似方法相媲美甚至更好的性能,适用于边缘实时机器人技术。
Sep, 2023
本文提出了一种基于区域的主动学习方法,通过新的采集策略和本地预测一致性以及负学习,旨在在域移位下实现语义分割。实验表明,我们的方法只需要很少的注释就可以接近监督性能,并且明显优于现有方法。
Nov, 2021
本文研究了多模态信号处理和分析的应用,通过利用信息计量的概念和 InfoMeter 系统,分析了自动驾驶的大规模数据集中的多模态 3D 物体检测系统,并提出了低模态间信息量对于检测准确性有益的新见解。
May, 2024