通过扩散特征聚合进行物体姿态估计
提出一种新颖的姿态估计框架 (DiffPose),基于扩散模型将 3D 姿态估计描述为一个逆扩散过程,并引入了姿态特定初始化、基于高斯混合模型的前向扩散过程和上下文条件的逆扩散过程等新设计来促进扩散过程,相比现有方法在 Human3.6M 和 MPI-INF-3DHP 等广泛使用的姿态估计基准测试中显著提升。
Nov, 2022
本文提出了一种基于条件生成建模的目标姿态估计方法,该模型采用基于得分的扩散模型来估计对象姿态,借助二步过程(似然度估计和均值池化)从扩散模型中抽样候选项并综合其结果,约束了不确定性。该方法在 REAL275 数据集上实现了最先进的性能,且不需要微调即可适应具有相似对称性质的新类别,且能够产生与当前最先进的基线相当的结果。
Jun, 2023
我们介绍了 3DiffTection,这是一种用于从单张图像中进行 3D 物体检测的最先进方法,利用了来自 3D 感知扩散模型的特征。通过两种专门的调整策略:几何和语义,我们的方法弥合了这些差距。通过我们的方法,我们获得了为 3D 检测量身定制的 3D 感知特征,以及在识别跨视角点对应方面表现出色的能力。
Nov, 2023
DiffPose 是一种新颖的扩展扩散模型,将基于视频的人体姿势估计作为条件热图生成问题,并通过多组姿势估计的结合以及迭代步骤的调整来提高预测准确性,成功地在 PoseTrack2017、PoseTrack2018 和 PoseTrack21 三个基准测试上取得了新的最佳结果。
Jul, 2023
基于扩散模型和逆扩散算法的 6D 物体姿态估计框架,在减少噪声和不确定性的基础上实现准确的 2D-3D 对应,并通过对物体特征进行条件优化,取得了较好的性能。
Dec, 2023
基于光线组合的相机姿势的分布式表示以及基于回归和扩散的方法,在 CO3D 数据集上展现了最新的性能,并在未见过的物体类别和野外捕捉中表现出广泛适应性。
Feb, 2024
比较了基于 GAN 和扩散模型的图像翻译网络在 6D 物体姿态估计任务中的表现,结果表明扩散模型优于 GAN,揭示了进一步改进物体姿态估计模型的潜力。
Feb, 2024
利用物体先验知识,本文提出一种有效的方法,通过合成新视图图像来确定物体姿态,从而准确确定两个视图的相机姿态,并且在大视角变化下展现出卓越的稳健性和泛化性能。
Feb, 2024
通过将 Diffusion 模型与特征提取技术相结合,本文提出了 Zero123-6D 方法,并在 CO3D 数据集上进行了实验,展示了在类别级别上通过扩展稀疏的纯 RGB 参考视图来提高零侧位姿估计性能、减少数据需求以及消除对深度信息的需求。
Mar, 2024