无监督地发现物体地标作为结构表示
本文提出了一种使用深度神经网络在无监督条件下发现和学习物体类别中的标志的新方法,从而表征它们的结构。我们还展示了这种学习出的标志建立了不同对象实例之间的有意义的对应关系,并可以与高精度回归手动注释的标志。
May, 2017
提出了一种无需手动监督来学习视觉对象(例如面部中的眼睛和鼻子)的地标探测器的方法,通过几何提取过程中引入的紧密瓶颈,结合外观和几何来生成图片,该方法适用于多种数据集,包括人脸、人物、3D 对象和数字,同时在无监督地标检测方面优于现有最先进的技术。
Jun, 2018
本文提出了一种深度结构化面部标记检测方法,该方法使用深度卷积网络和条件随机场相结合,能够在面部标记检测上取得比现有技术更卓越的性能,特别是在包含大姿态和遮挡等具有挑战性的数据集上具备更好的泛化性能。
Oct, 2020
该论文提出了一种将基于实例和空间差异的对比学习相结合的简单而有效的方法,在训练的中间层次中表示对象明显地预测对象地标,通过空间对比学习进一步提高匹配和少量样本标志物回归任务的性能。该方法优于现有同类方法,并在标志物学习的标准基准测试以及该论文提出的新挑战上得到了验证。
Jun, 2020
介绍了一种采用半监督学习方法,在没有 3D 地标数据集的情况下,通过直接提取(可见的)手工标记的 2D 地标,并确保更好的定义对齐,从而学习 3D 地标。该方法利用 3D 感知的生成对抗网络进行更好的多视角一致性学习,并利用实景多帧视频进行鲁棒的跨领域泛化。实证实验证明,该方法不仅在 2D-3D 地标之间实现了更好的定义对齐,还在 3DMM 标记和摄影测量基准数据集上优于其他监督学习的 3D 地标定位方法。
May, 2024
本文介绍了一种 LEAD 方法,用于从未注释的类别特定图像集合中发现地标。通过采用两阶段训练方法,该方法增强了自监督学习中密集等变表示的学习,并在极度有限的注释数下提高了地标检测的性能,同时提高了跨尺度变化的泛化能力。
Apr, 2022
本文研究了关键点检测中使用的无监督学习方法,重点介绍了其不能生成等变中间卷积特征的问题,并提出了一种两步无监督方法,该方法通过首先学习强大的基于像素的特征,然后使用预训练的特征来通过传统的等变性方法学习关键点检测器。在多个挑战性的标志性检测数据集上实现了最先进的结果,例如 BBC Pose 数据集和 Cat-Head 数据集,并在一系列基准测试中表现出色。
Apr, 2021
本研究提出了一种非监督学习方法来发现和分割物体部分,通过像素级别的图像重建配合先前任务的代理目标,得到了一种更有意义的部分分解方法,优于现有的三个基准数据集,提供了一种一致的、可视化的物体语义部分表示。
Nov, 2021
本论文介绍了一种无监督学习方法,将三维形状信息嵌入到单视图图像表示中,通过使用单个 2D 图像的自监督训练目标,在没有人工语义标签的前提下,鼓励表示捕捉基本形状原语和语义规律,最终学习得到一个强大的表示方法,可以成功进行物体识别和 “心理旋转” 操作,成果优于相对应的其他无监督学习方法。
Sep, 2017