区域互信息损失在语义分割中的应用

Oct, 2019

区域互信息损失在语义分割中的应用

Region Mutual Information Loss for Semantic Segmentation

Shuai Zhao, Yang Wang, Zheng Yang, Deng Cai

TL;DR本文提出了一种区域互信息（RMI）损失，来更简单、高效地建模像素之间的相关性，以优化语义分割任务中的像素分类问题。在测试过程中，RMI 只需要几个额外的计算资源，具有较高的性能表现。

Abstract

semantic segmentation is a fundamental problem in computer vision. It is considered as a pixel-wise classification problem in practice, and most segmentation models use a →

semantic segmentation dependency modeling region mutual information pixel-wise loss computer vision

发现论文，激发创造

最大化互信息和对抗正则化的无监督图像分割

本文提出了一种全新的完全无监督语义分割方法，名为 InMARS，以信息最大化和对抗性正则化分割为基础，并结合对抗性训练策略，通过像人类感知一样先将输入图像分区，然后将其聚类为语义上有意义的类别，其实验结果表明在两个常用的无监督语义分割数据集上，InMARS 方法取得了最先进的性能。

Jul, 2021

区域级别的对比一致性学习用于半监督语义分割

本文提出了基于区域级别对比和一致性学习框架 (RC^2L) 的半监督语义分割方法，通过引入区域级别损失，包括 Region Mask Contrastive (RMC) 损失、Region Feature Contrastive (RFC) 损失、Region Class Consistency (RCC) 损失和 Semantic Mask Consistency (SMC) 损失，实现了更好的稳定性和性能。在 PASCAL VOC 2012 和 Cityscapes 数据集上的实验结果表明，所提出的方法优于现有最先进方法。

Apr, 2022

InfoSeg: 基于互信息最大化的无监督语义图像分割

本文提出了一种基于自监督学习的无监督语义图像分割的新方法，通过局部和全局高级别图像特征间的互信息最大化计算多个高级别特征，实现对不同语义类别的图像分割和互信息最大化的两阶段学习过程，并在已有数据集和引入的 COCO-Persons 数据集上相对推进了 26%（基于像素准确率评估）。

Oct, 2021

空间语义循环挖掘用于指代图像分割

本研究提出了 Spatial Semantic Recurrent Mining (S extsuperscript {2} RM) 方法，用于实现高质量的跨模态融合，包括分布语言特征、空间语义递归协同解析和解析语义平衡，并结合 Cross-scale Abstract Semantic Guided Decoder (CASG) 来凸显指代物的前景。实验证明，该方法在四个具有挑战性的数据集上表现优于其他先进算法。

May, 2024

基于基础模型的图像匹配：开放词汇语义分割的新视角

基于视觉基于模型，提出了一种关系感知的单模态匹配 (OVS) 框架，用于解决像素分组和区域识别方法中图像特征与类别标签之间的误匹配问题，并在三个基准测试中展现出大幅度优势。

Mar, 2024

互信息校准的边缘环境不确定性感知多模态三维物体检测

通过将协同推断原理与信息理论测量相集成，我们的研究在多模态框架内实现了轻量级、无蒙特卡罗的不确定性估计，并通过多元高斯变分自动编码器的潜变量的乘积来融合 RGB 摄像机和 LiDAR 传感器数据的特征以提高预测准确性。通过基于加权损失函数的 CI 得出的不确定性边界的标准化互信息被用作调制器。我们的仿真结果表明，在模型训练期间，内在的预测不确定性与 NMI 呈负相关。该框架在 KITTI 3D 物体检测基准上展示了与不具备不确定性感知能力的相似方法相媲美甚至更好的性能，适用于边缘实时机器人技术。

Sep, 2023

自回归无监督图像分割

该研究提出了一种基于不同视图之间的互信息最大化的新的无监督图像分割方法，该方法利用不同形式的掩蔽卷积构建数据的不同视图，用于表示学习或聚类。

Jul, 2020

面向更少标注：基于区域不纯度和预测不确定性的主动学习，用于领域自适应语义分割

本文提出了一种基于区域的主动学习方法，通过新的采集策略和本地预测一致性以及负学习，旨在在域移位下实现语义分割。实验表明，我们的方法只需要很少的注释就可以接近监督性能，并且明显优于现有方法。

Nov, 2021

多模式学习系统中的互信息分析

本文研究了多模态信号处理和分析的应用，通过利用信息计量的概念和 InfoMeter 系统，分析了自动驾驶的大规模数据集中的多模态 3D 物体检测系统，并提出了低模态间信息量对于检测准确性有益的新见解。

May, 2024

探索跨图像像素对比用于语义分割

提出了一个利用对比学习实现像素级别度量学习的语义分割框架，能够从全局上探索标记像素的结构，并在多个数据集上带来了显著的性能改进。

Jan, 2021