通过扩散模型获取六自由度稳定场
提出了一种基于多视角视野的实时视觉系统,可以从单个 RGB-D 视角提出三维物体姿态建议,并且根据多个视角的姿态估计和非参数占用信息积累这些姿态估计,从而对接触的多个已知对象进行一致的、不相交的姿态估计。应用于实时机器人应用程序中,只使用机载 RGB-D 视觉,机械臂可以精确而有序地拆卸复杂的物体堆放,展示了其准确性和鲁棒性。
Apr, 2020
本研究提出了一种基于部分点云观察的,用于在杂乱场景中规划指定物体 6 自由度抓取的方法,其性能比基线方法高出 17.6%,能够成功清理包含 23 个未知物体和 51 次抓取操作的 9 个杂乱桌面场景,并利用我们学习到的碰撞检查模块来推理有效的抓取顺序,以检索不易到达的物体。
Dec, 2019
本文介绍了 Diffusion-EDFs,一种新颖的方法,将 SE (3)- 等变性(roto-translation equivariance)引入扩散生成模型中,展示出了卓越的数据效率,只需要 5 至 10 个任务演示进行有效的端到端训练,并且相比以前的基于扩散的操作方法,具有更好的泛化能力。
Sep, 2023
通过引入得分基础扩散方法进行 $SE (3)$ 分组,针对姿态估计任务进行特定设计,优化 Langevin 动力学的收敛性和计算效率。在实验中,证明该方法处理姿态的模糊性,缓解透视引起的模糊性并展示了该 surrogate Stein 分数制定在 $SE (3)$ 上的鲁棒性。因此,我们开创了一种有前途的 6D 对象姿态估计策略。
May, 2023
使用神经场将机器人的运动学作为神经隐式查询模型来自建模,能够实现比现有方法更广泛的应用,从而为自主代理提供必要的自我建模功能,并在运动规划任务中展示该模型的能力。
Oct, 2023
使用商用运动捕捉系统获取真实物体的高度准确地面真实姿态,并通过三个不同的场景评估了具有稳定性和抗干扰能力的 6-DOF 追踪器的性能,通过深度学习构建的跟踪器的性能对比先前的方法具有较大的优势。
Mar, 2018
本文介绍了如何使用扩散模型和面向对象的变压器构建物理有效的结构,以便在多步骤的三维规划任务中创建复杂的配置。实验结果表明,该方法相对于现有的多模态变压器模型,改进了 16%的成功率,同时扩展了一种多任务模型来产生更广泛的不同构型。
Nov, 2022
本文介绍了一种基于深度卷积神经网络的方法,能够通过对特定对象类的分类和姿态回归,从单个或多视图中准确地推断大量对象类的六自由度姿态,并通过 SE(3)的均匀镶嵌提高了鲁棒性。作者还提出了一种适用于单视角存在歧义的高效多视图框架,并在 YCB-Video、JHUScene-50 和 ObjectNet-3D 三个大规模基准测试中取得了优异的表现,与目前现有技术相比表现优秀。
Mar, 2018
该研究针对机器人的操作问题,使用深度传感器感知场景,并且在六维空间内移动其末端执行器的 3D 位置和方向。 使用马尔可夫决策过程的方法来解决问题,通过层次 SE(3)采样方法添加动作约束以达到任务目标,论文展示了该方法对于三个具有挑战性的摆放任务(均为杂乱的非常规场景)的有效性,且所有的训练均在模拟环境中进行。
Jun, 2018
本研究介绍了一种基于 SE (3) 扩散模型的点云注册框架,用于实现现实场景下的 6D 物体姿态估计。我们的方法将 3D 注册任务作为一种去噪扩散过程,逐步改进源点云的姿态,以与模型点云精准对齐。通过 SE (3) 扩散过程和 SE (3) 反向过程对我们的框架进行训练。
Oct, 2023