相机作为光线:通过光线扩散进行姿态估计
提出一种新颖的姿态估计框架 (DiffPose),基于扩散模型将 3D 姿态估计描述为一个逆扩散过程,并引入了姿态特定初始化、基于高斯混合模型的前向扩散过程和上下文条件的逆扩散过程等新设计来促进扩散过程,相比现有方法在 Human3.6M 和 MPI-INF-3DHP 等广泛使用的姿态估计基准测试中显著提升。
Nov, 2022
DiffPose 是一种新颖的扩展扩散模型,将基于视频的人体姿势估计作为条件热图生成问题,并通过多组姿势估计的结合以及迭代步骤的调整来提高预测准确性,成功地在 PoseTrack2017、PoseTrack2018 和 PoseTrack21 三个基准测试上取得了新的最佳结果。
Jul, 2023
本文提出了一种基于光线的单目 3D (Ray3D) 绝对人体姿态估计方法,通过将输入数据从像素空间转换为三维规范化光线并明确将相机外参作为输入,该方法具有优异的泛化性能,并能显著超越现有的同类模型。
Mar, 2022
该研究利用经过预训练的扩散模型,提出了一种名为 ID-Pose 的方法,可通过给定两张输入图像来估计相对姿态,该方法不需要训练,可处理多张图像,并且在实际图像中具有广泛应用性。
Jun, 2023
基于扩散模型和逆扩散算法的 6D 物体姿态估计框架,在减少噪声和不确定性的基础上实现准确的 2D-3D 对应,并通过对物体特征进行条件优化,取得了较好的性能。
Dec, 2023
本文提出了一个新颖的端到端框架,用于从单眼图像或序列中估计三维手部姿势。通过使用用于生成目的的扩散模型并引入显式的正向运动学层,我们确保生成的姿势符合实际。通过在连续帧的时间窗口上添加 Transformer 模块,我们在提升精确度的同时克服了抖动问题。该方法在几个不同的数据集上通过定量和定性评估展示了领先的鲁棒性、泛化性和准确性。
Aug, 2023
mmDiff 是一种针对嘈杂雷达数据的新型扩散式姿势估计器,解决了人体部分的漏检和环境干扰引起的信号不一致性等两个关键挑战,通过设计多个模块提供可靠的条件,显著优于现有方法,在公共数据集上实现了最先进的性能。
Mar, 2024
比较了基于 GAN 和扩散模型的图像翻译网络在 6D 物体姿态估计任务中的表现,结果表明扩散模型优于 GAN,揭示了进一步改进物体姿态估计模型的潜力。
Feb, 2024
本文提出了一种基于条件生成建模的目标姿态估计方法,该模型采用基于得分的扩散模型来估计对象姿态,借助二步过程(似然度估计和均值池化)从扩散模型中抽样候选项并综合其结果,约束了不确定性。该方法在 REAL275 数据集上实现了最先进的性能,且不需要微调即可适应具有相似对称性质的新类别,且能够产生与当前最先进的基线相当的结果。
Jun, 2023