利用主要掩码提案增强无监督语义分割
本文旨在通过采用对比优化目标中的预定中级先验,引入了一个两步框架来学习像素嵌入,从而解决了计算机视觉中的无监督语义表示学习问题,并证明此方法优于现有方法。
Feb, 2021
本文提出了一种使用图像级别标签进行实例分割的新框架,其中分为两个阶段,分别是训练分类器生成伪掩模并在这些伪掩模上训练完全监督的 Mask R-CNN。在 PASCAL VOC 2012 数据集上进行实验,相对于现有方法说明主要性能提高。
Jul, 2019
该论文提出 MaskDistill 这一基于数据驱动策略的无监督语义分割框架,通过生成像素分组先验和聚类对象掩模来训练初始对象分割模型并过滤低质量对象掩模,从而有效提高 PASCAL 和 COCO 上的性能。
Jun, 2022
我们提出了一个用于无监督语义分割的轻量级聚类框架,基于自监督视觉变换器的注意特征,通过将这些特征聚类成少量的聚类中心,我们能够将前景和背景的图像补丁分开成不同的组。我们的框架在无监督语义分割方面展示了很大的潜力,并在 PASCAL VOC 和 MS COCO 数据集上取得了最新的成果。
Nov, 2023
该论文提出了 SEMPART 算法,它能够快速生成高质量的掩码,同时在图像的 DINO-based 语义图上联合推断粗细二分图,用图驱动的正则化方法保留了边界细节,并成功地将粗略的掩码语义提炼为精细的掩码语义。
Sep, 2023
本文提出了一种无需预测提议、将 amodal mask 分配到不同层级、通过在每一层独立地进行 amodal 实例回归来预测交通参与者及其语义标签的 proposal-free 多标签多类别无缝分割网络,并采用共享骨干和不对称双解码器的 et 架构以及 amodal mask refiner,其在 BDD100K-APS 和 KITTI-360-APS 数据集上的测试表明超越了现有技术水平。
May, 2022
本文提出了 SeMask 框架,将语义信息嵌入预训练分层 Transformer 模块的编码器中以提高模型性能,并使用轻量级语义解码器进行训练。实验结果表明,嵌入语义先验可以显著提高模型效果,并且与 Swin Transformer 和 Mix Transformer 等模型相结合,达到了 58.25%的 mIoU 表现。
Dec, 2021
该论文的主要研究方向是关于使用无标签方法进行细胞识别,通过先前的自激活图生成伪掩膜作为训练目标,并引入语义聚类模块将先前的自激活图转换为像素级语义伪掩膜,在细胞分割和多类别细胞检测的数据集上取得了竞争性的性能,同时还展示了先前自激活图在解决医学领域标签不足问题方面的潜力。
Aug, 2023
本文提出一种跨模态伪标签(cross-modal pseudo-labeling)框架,用于面向开放词汇的实例分割,通过与对象掩膜的视觉特征对齐,实现对字词语义中的新类别进行标记,从而自我训练出一个学生模型,缓解了伪掩膜中存在的噪声干扰所带来的不良影响,相比现有工作,在 MS-COCO 和 Open Images & Conceptual Captions 数据集上分别实现了 4.5% 和 5.1% 的 mAP 得分提高。
Nov, 2021
为了解决弱监督语义分割中伪掩模生成和嘈杂伪掩模监督训练的问题,我们提出了一种新的方法,利用系数变化平滑、比例伪掩模生成、假冒欠拟合和循环伪掩模等技术,取得了 PAS-CAL VOC 2012 和 MS COCO 2014 两个语义分割数据集的最新成果,在性能方面全面超越之前的结果。
Aug, 2021