走向人类级别的三维相对姿态估计：通用化、免训练、单个参考

Jun, 2024

走向人类级别的三维相对姿态估计：通用化、免训练、单个参考

Towards Human-Level 3D Relative Pose Estimation: Generalizable, Training-Free, with Single Reference

Yuan Gao, Yajing Luo, Junhong Wang, Kui Jia, Gui-Song Xia

TL;DR用 RGB-D 参考图像的 2.5D 形状、现成可微分渲染器以及 DINOv2 预训练模型提取的语义线索为基础，无需标记和训练，提出了一种新颖的可推广的三维相对姿态估计方法，通过渲染与对比新的 RGB 和语义地图，实现了只需单个 RGB-D 参考图像可用于未见过的对象的姿态估计。

Abstract

Humans can easily deduce the relative pose of an unseen object, without label/training, given only a single query-reference image pair. This is arguably achieved by incorporating (i) 3D/2.5D shape perception from a single image, (ii) render-and-compare simulation, and (iii) rich semant

relative pose estimation 3d shape perception render-and-compare simulation semantic cues generalization

发现论文，激发创造

通用相对物体姿态估计的三维感知假设与验证

通过单个参考视图与查询图像之间的相对物体姿态估计，我们提出了一种基于假设和验证框架的新方法，并引入了一种 3D 感知验证，以衡量可靠性，证明了我们方法在相对姿态估计和处理未见过的物体时的鲁棒性。

Oct, 2023

相对论：弱监督数据下的单目三维人体姿态估计

通过弱监督学习和人群注释者提供的深度相对估计信号，我们提出一种 3D 人体姿势估计算法，用于只在 2D 输入图像中学习。结果竞争力优于目前现有算法，可为在未经过精心控制的现实世界中进行 3D 姿势估计开辟道路。

May, 2018

RGBD 图像中的人体姿态三维估计用于机器人任务学习

利用 RGBD 图像估算 3D 人体姿态，通过关键点检测器和深度信息实现 3D 提升，在真实环境下通过学习演示框架指示服务机器人模仿人类教师的操作，超越了单眼调色板和深度姿态估计方法的性能。

Mar, 2018

混合表示下的极端相对姿态网络

本文介绍了一种新的 RGB-D 相对位姿估计方法，该方法适用于小重叠或非重叠扫描，并且可以输出多个相对位姿。该方法执行场景补全和匹配补全的扫描。

Dec, 2019

野外物体的三维姿态估计和三维模型检索

本文提出了一种可扩展，高效和准确的方法，用于检索野外对象的 3D 模型，包括了 3D 姿态估计，使用姿态先验来检索 3D 模型，使用基于 CNN 的多视图度量学习方法从 RGB 图像中检索图像描述符与采用的渲染深度图像匹配的深度图像得出精准的 3D 模型，报告了 Pascal3D + 上 3D 模型的定量结果。

Mar, 2018

单张 RGB 图像的 3D 多人姿态估计之基于相机距离的自顶向下方法

本文提出了一种全面的基于学习的、视野距离感知的自顶向下的方法，用于从单个 RGB 图像中估计多人的 3D 姿态，并通过人体检测、3D 人体根位置定位和相对根姿态估计模块，实现了与最先进单人 3D 姿态估计模型可相媲美的结果，同时也比公开数据集上之前的 3D 多人姿态估计方法表现更出色。

Jul, 2019

PFRL: 无需姿态信息的强化学习在 6D 姿态估计中的应用

通过强化学习，使用 2D 图像注释作为微弱监督的 6D 姿态信息，我们构建了一个无需真实世界 6D 标签的 6D 姿态微调模型，从而实现了优化姿态模型的有效方法。

Feb, 2021

基于弱深度监督的多人绝对三维人体姿态估计

本文提出了一种利用 RGB-D 图像进行弱监督训练的网络，用于多人绝对姿态估计，可缓解缺乏大规模、多样化数据集的问题，并在多个数据集中实现了持续的错误率改进与在 MuPoTS-3D 数据集上的全球领先结果

Apr, 2020

单幅 RGB 帧的基于语义关键点的姿态估算

该论文提出了一种从单个 RGB 图像中估计物体连续 6-DoF 姿态的方法，该方法结合了经卷积网络预测的语义关键点和可变形的形状模型，同时采用了半自动数据生成技术来训练可学习组件，在实验中该方法达到了与现有技术相当的结果。

Apr, 2022

单图像三维人体姿态估计的双源方法

本研究提出一种利用双重数据源，结合深度神经网络和运动捕捉数据，实现从单张图片中估计三维人体姿态的方法，并对该方法进行了全面评估。

May, 2017