CVPRJun, 2024

以语言为驱动的抓取检测

TL;DR本论文介绍了 Grasp-Anything++,一种新的以自然语言为驱动的抓握检测数据集,包含超过 100 万个样本、300 多万个物体和 1000 万个抓握指令。我们提出了基于扩散模型的新型语言驱动抓握检测方法,通过对抓握指令进行去噪处理来检测抓握姿势,并展示了我们的方法在理论上的支持以及在实验证明了它的优越性能。同时,我们的大规模数据集为零短抓握检测提供了支持,并成为未来工作的挑战性基准。