Zero123-6D：RGB类别级别6D姿态估计的零样本新视角合成

Mar, 2024

Zero123-6D：RGB类别级别6D姿态估计的零样本新视角合成

Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation

Francesco Di Felice, Alberto Remus, Stefano Gasperini, Benjamin Busam, Lionel Ott...

TL;DR通过将Diffusion模型与特征提取技术相结合，本文提出了Zero123-6D方法，并在CO3D数据集上进行了实验，展示了在类别级别上通过扩展稀疏的纯RGB参考视图来提高零侧位姿估计性能、减少数据需求以及消除对深度信息的需求。

Abstract

Estimating the pose of objects through vision is essential to make robotic platforms interact with the environment. Yet, it presents many challenges, often related to the lack of flexibility and generalizability of state-of-the-art solutions. →

发现论文，激发创造

Uni6D：一种无需投影降解的6D姿态估计统一卷积神经网络框架

使用Uni6D方法，通过以extra UV data毗邻RGB-D图像输入和仅一个CNN骨干实现统一的6D姿态估计，从而解决1D深度值在2D平面的投影失配问题，并在YCB-视频数据集上取得可比的精度和7.2倍的推理速度。

Mar, 2022

MV6D: 使用深度点投票网络的RGB-D框架多视角6D位姿估计

提出了一种名为MV6D的多视角6D姿态估计方法，该方法使用多个视角的RGB-D图像，通过DenseFusion层融合每个视角的图像，可以精确预测杂乱场景中所有对象的6D姿态.

Aug, 2022

通过SE(3)上基于分数的扩散解决6D目标姿态估计中的歧义问题

通过引入得分基础扩散方法进行 $SE(3)$ 分组，针对姿态估计任务进行特定设计，优化 Langevin 动力学的收敛性和计算效率。在实验中，证明该方法处理姿态的模糊性，缓解透视引起的模糊性并展示了该 surrogate Stein 分数制定在 $SE(3)$ 上的鲁棒性。因此，我们开创了一种有前途的 6D 对象姿态估计策略。

May, 2023

机器人中单目6D物体位姿估计的挑战

物体姿态估计是一项核心感知任务，针对单目相机方法，其主要挑战包括遮挡处理、姿态表示、类别级姿态估计以及不确定性估计。

Jul, 2023

ZS6D: 使用视觉变换器进行零样本6D物体姿态估计

通过使用预训练的Vision Transformers（ViT）提取的视觉描述符，我们引入了ZS6D方法，用于零样本新目标6D姿态估计，该方法在众多最新的姿态估计方法上表现卓越，无需进行特定任务的微调。我们在LMO、YCBV和TLESS等三个数据集上进行了实验，并与两种方法进行了比较，结果在所有三个数据集上相较于其中一种方法有显著提升，在两个数据集上相较于另一种方法有提升。

Sep, 2023

ZeroNVS: 从单张真实图像实现零射击360度视角综合

我们引入了一个三维感知扩散模型ZeroNVS，用于野外场景下的单图像新视图合成。通过训练一种生成式先验模型来处理多物体场景和复杂背景带来的挑战，提出了新的技术。我们还提出了一种新颖的相机条件参数化和归一化方案，以解决深度尺度的二义性问题。此外，我们注意到Score Distillation Sampling（SDS）在蒸馏360度场景时倾向于截断复杂背景的分布，并提出了“SDS anchoring”以改善合成新视图的多样性。我们的模型在DTU数据集的零样本设置中取得了新的LPIPS优势，甚至优于专门在DTU上训练的方法。我们进一步将具有挑战性的Mip-NeRF 360数据集调整为单图像新视图合成的新基准，并在该设置中展现出强大的性能。我们的代码和数据位于此http URL。

Oct, 2023

Diff-OP3D：连接2D扩散以进行Open Pose 3D零样本分类

通过在3D视觉领域运用Contrastive Language-Image Pre-training (CLIP)方法，本论文提出了一个更具挑战性的3D开放姿态零样本分类基准，并通过设计一个简洁的角度优化机制以及将2D预训练扩散模型应用于3D零样本分类，成功提高了模型性能，验证了扩散方法在3D零样本任务中的有效性。

Dec, 2023

6D-Diff: 一个用于6D物体姿态估计的关键点扩散框架

基于扩散模型和逆扩散算法的6D物体姿态估计框架，在减少噪声和不确定性的基础上实现准确的2D-3D对应，并通过对物体特征进行条件优化，取得了较好的性能。

Dec, 2023

利用扩散模型改进2D-3D稠密对应关系以提高6D物体姿态估计

比较了基于GAN和扩散模型的图像翻译网络在6D物体姿态估计任务中的表现，结果表明扩散模型优于GAN，揭示了进一步改进物体姿态估计模型的潜力。

Feb, 2024

基于RGB的一次性视角规划中利用来自3D扩散模型的先验知识

通过利用扩散模型的强大的3D生成能力作为先验，我们提出了一种新颖的一次性视图规划方法，从而实现了仅通过对象的单个RGB图像开始进行高效的一次性视图规划，以平衡对象重建质量和移动成本。

Mar, 2024