无监督地发现物体地标作为结构表示

Apr, 2018

无监督地发现物体地标作为结构表示

Unsupervised Discovery of Object Landmarks as Structural Representations

Yuting Zhang, Yijie Guo, Yixin Jin, Yijun Luo, Zhiyuan He...

TL;DR本文提出一种基于自动编码器的方法，无需监督信号，从而学习图像模型中的对象结构，发现了与手动注释地标更为相关的语义有意义的地标，这些地标是识别视觉属性的补充特征，并且自然地创建了一个无监督、可感知的界面，用于操纵对象形状和解码具有可控结构的图像。

Abstract

deep neural networks can model images with rich latent representations, but they cannot naturally conceptualize structures of object categories in a human-perceptible way. This paper addresses the problem of learning object structures in an →

deep neural networks image modeling object structures autoencoding landmarks

发现论文，激发创造

分解空间嵌入实现物体标志无监督学习

本文提出了一种使用深度神经网络在无监督条件下发现和学习物体类别中的标志的新方法，从而表征它们的结构。我们还展示了这种学习出的标志建立了不同对象实例之间的有意义的对应关系，并可以与高精度回归手动注释的标志。

May, 2017

通过条件图像生成进行无监督物体地标学习

提出了一种无需手动监督来学习视觉对象（例如面部中的眼睛和鼻子）的地标探测器的方法，通过几何提取过程中引入的紧密瓶颈，结合外观和几何来生成图片，该方法适用于多种数据集，包括人脸、人物、3D 对象和数字，同时在无监督地标检测方面优于现有最先进的技术。

Jun, 2018

面部特征点检测的深度结构预测

本文提出了一种深度结构化面部标记检测方法，该方法使用深度卷积网络和条件随机场相结合，能够在面部标记检测上取得比现有技术更卓越的性能，特别是在包含大姿态和遮挡等具有挑战性的数据集上具备更好的泛化性能。

Oct, 2020

物体标志表示的等变和不变学习

该论文提出了一种将基于实例和空间差异的对比学习相结合的简单而有效的方法，在训练的中间层次中表示对象明显地预测对象地标，通过空间对比学习进一步提高匹配和少量样本标志物回归任务的性能。该方法优于现有同类方法，并在标志物学习的标准基准测试以及该论文提出的新挑战上得到了验证。

Jun, 2020

使用姿态引导的二阶段聚类进行无监督地标发现的自训练

使用自训练、聚类和伪标注方法，通过扩展传播模型的潜在特性，提出的无监督地标发现方法在多个基准测试中明显优于现有方法。

Mar, 2024

FaceLift: 半监督的三维面部关键点定位

介绍了一种采用半监督学习方法，在没有 3D 地标数据集的情况下，通过直接提取（可见的）手工标记的 2D 地标，并确保更好的定义对齐，从而学习 3D 地标。该方法利用 3D 感知的生成对抗网络进行更好的多视角一致性学习，并利用实景多帧视频进行鲁棒的跨领域泛化。实证实验证明，该方法不仅在 2D-3D 地标之间实现了更好的定义对齐，还在 3DMM 标记和摄影测量基准数据集上优于其他监督学习的 3D 地标定位方法。

May, 2024

通过分布对齐特征相似度实现自监督地标估计

本文介绍了一种 LEAD 方法，用于从未注释的类别特定图像集合中发现地标。通过采用两阶段训练方法，该方法增强了自监督学习中密集等变表示的学习，并在极度有限的注释数下提高了地标检测的性能，同时提高了跨尺度变化的泛化能力。

Apr, 2022

预训练等变特征改进了无监督地标发现

本文研究了关键点检测中使用的无监督学习方法，重点介绍了其不能生成等变中间卷积特征的问题，并提出了一种两步无监督方法，该方法通过首先学习强大的基于像素的特征，然后使用预训练的特征来通过传统的等变性方法学习关键点检测器。在多个挑战性的标志性检测数据集上实现了最先进的结果，例如 BBC Pose 数据集和 Cat-Head 数据集，并在一系列基准测试中表现出色。

Apr, 2021

对比重构中的无监督部件发现

本研究提出了一种非监督学习方法来发现和分割物体部分，通过像素级别的图像重建配合先前任务的代理目标，得到了一种更有意义的部分分解方法，优于现有的三个基准数据集，提供了一种一致的、可视化的物体语义部分表示。

Nov, 2021

ShapeCodes: 将视角提升至视图网格以进行自我监督特征学习

本论文介绍了一种无监督学习方法，将三维形状信息嵌入到单视图图像表示中，通过使用单个 2D 图像的自监督训练目标，在没有人工语义标签的前提下，鼓励表示捕捉基本形状原语和语义规律，最终学习得到一个强大的表示方法，可以成功进行物体识别和 “心理旋转” 操作，成果优于相对应的其他无监督学习方法。

Sep, 2017