Feb, 2024

PhyGrasp: 基于物理信息的大型多模态模型的机器人抓取泛化

TL;DR将物理常识推理融入机器人操作,通过 PhyGrasp 模型结合自然语言和 3D 点云输入,实现对对象的物理属性准确评估和最优抓取位姿决策。模型的语言理解能力使其能够解释人类指令,并生成符合人类偏好的抓取位姿。在长尾场景中,PhyGrasp 取得了最先进的性能,成功率比 GraspNet 提高了约 10%。