通过引入全局、基于集合的对比损失和基于注意力的编码器,将个体目标表示相互对比更改为聚合表示并相互对比,从而在自监督学习中更有效地推动物体中心表示的出现,并在两个合成视频数据集上得到更好的效果。
Nov, 2020
本文探讨了从无标签场景中心数据中学习视觉表示的问题,提出了一种的基于对比学习和数据驱动语义槽的语义聚类和表示学习方法,通过此方法能够更好的区分特征和语义相符的像素点,以此来有效地分解场景中的像素群组,并显著提高目标检测、实例分割和语义分割等下游应用的效果。
May, 2022
本文探讨使用反差学习作为辅助训练目标来促进更通用和可转移的特征,在此基础上提出了一种基于注意力的空间反差目标来学习本地区分和类别不可知特征。通过大量实验证明了该方法优于最先进的方法,证实了学习良好、可转移的嵌入在 few-shot 学习中的重要性。
Dec, 2020
本文将需要自我学习来改进现有模型的数据集偏差性进行了深入研究,并成功地在不同类型数据集上改善了模型,同时介绍了一种具有多尺度裁剪、强数据增强和近邻策略的改进自监督学习方法,并通过 MoCo 模型在语义分割和视频实例分割任务中实现了优秀的效果。
Jun, 2021
该研究对现有的物体中心模型的概念限制进行了识别和分析,提出了一种基于复值激活和对比学习的改进同步模型。通过引入新的构架和方法,该同步模型可以在多物体彩色数据集中无监督地发现物体,并同时表示超过三个物体。
May, 2023
本文通过研究在 12 个不同领域和物体检测任务中的线性评估、全网络转移和少样本识别等方面,系统地探讨了对比学习的不同方法学习到的表示的可迁移性,结果表明对比方法学习到的表示很容易适应不同的任务。除此之外,自监督对比损失与交叉熵 / 监督对比损失的联合目标可增强这些模型的可迁移性。
Mar, 2021
利用无监督技术从视觉数据中学习多对象动态是一项具有挑战性的任务。本文提出一种新的框架,通过机器人交互学习可以学到稳健的对象表示的两个新架构:SlotTransport 用于从 RGB 图像中发现对象表示,SlotGNN 用于从 RGB 图像和机器人交互中预测它们的集体动态。
Oct, 2023
本文提出了一个名为 Slot Attention 的架构组件,它能够从低级感知特征中提取物体为中心的表示,并能够推广到未见组合。
Jun, 2020
该论文采用对比学习方法提出了一种基于空间区域的卷积神经网络无监督训练方法,可与传统的神经网络结构和训练技巧相结合,提高模型性能。
Nov, 2016
本文旨在通过采用对比优化目标中的预定中级先验,引入了一个两步框架来学习像素嵌入,从而解决了计算机视觉中的无监督语义表示学习问题,并证明此方法优于现有方法。
Feb, 2021