使用多标签自监督学习(MLS)方法,通过将场景 / 多标签图像的自监督学习简化为多标签分类问题,我们可以学习到高质量的图像表示,该方法在 MS-COCO 上获得了分类、检测和分割方面的最先进结果,并且比现有的方法简单易用,便于部署和进一步探索。
Aug, 2023
提出了一种自监督学习方法,适用于对象检测和语义分割等半全局任务,通过在训练期间最小化像素级的本地对比损失(LC-loss),在自学习特征中强制实现对变换后的同一图像的相应图像位置之间的本地一致性,可将 LC-loss 添加到现有的自监督学习方法中,并在 COCO、PASCAL VOC 和 CityScapes 数据集上评估 SSL 方法,结果比现有的先进自监督学习方法在 COCO 对象检测、PASCAL VOC 检测和 CityScapes 分割等任务上分别提高了 1.9%,1.4%和 0.6%。
Jul, 2022
使用自我监督学习方案对人工智能进行了重要进展,将对比学习整合到现有的自我监督学习模型中,在计算机视觉领域取得了显著的进展,通过提出的模型 Segmentation Localization 对密集预测的语义分割任务进行了评估,并通过实现每个类别一个队列的思想在 MoCo-v2 中避免了假阴性对。
Oct, 2023
本文深入分析了自监督学习的机制以及其对表示学习的影响,揭示了自监督学习在样本聚类方面的潜在驱动作用,同时证实了该方法所训练的表示与语义类别之间存在着密切的对齐关系,并且这种对齐关系随着训练和网络深度的加深而不断增强,这对于提高自监督学习方法的性能和效果具有重要的理论和实际意义。
May, 2023
自监督学习在生成的潜在变量模型和对比方法的框架下,提出了一种能够改善性能、实现任务无关性表示的方法。
Feb, 2024
本文设计了一种称为 SelfPatch 的简单而有效的视觉预训练任务,利用 ViT 的特性,在无需人工注释的情况下提高不同类型视觉任务的性能,通过训练神经网络对各种图像的无监督学习来实现。
Jun, 2022
本文提出了一种基于多级自监督学习模型的语义分割域自适应方法,通过分割多个子图像来生成空间独立且语义一致的伪标签,并计算图像级伪弱标签来捕捉源域和目标域中的全局上下文相似性,从而在像素数很少(例如小物体)的情况下帮助潜在空间学习表示。该方法在 GTA-V 到 Cityscapes 和 SYNTHIA 到 Cityscapes 的适应中均取得了优于现有方法的性能表现。
Sep, 2019
自我监督学习(SSL)可以用于解决复杂的视觉任务,该论文研究了实例分割的自我监督表示,发现不同 SSL 方法的特征在实例感知水平上存在差异。
Nov, 2023
Odin 是一种自我监督学习范式,通过耦合对象发现和表征网络来自主发现有意义的图像分割,而无需人工干预,可实现 COCO 目标检测、实例分割及 PASCAL、Cityscapes 的语义分割等领域的迁移学习效果,并在 DAVIS 视频分割方面超越监督预训练的方法。
Mar, 2022
利用自监督学习方法提升视觉地理定位技术性能和训练效率,通过统合 SimCLR、MoCov2、BYOL、SimSiam、Barlow Twins 和 VICReg 等多种自监督学习方法,研究训练策略和参数设置对视觉地理定位任务的适应性
Jul, 2023