Sep, 2024

可以做到!一个用于具身规划的大型多模态模型的数据集和神经符号基础框架

TL;DR本研究针对大型多模态模型在真实环境中的感知、推理、规划和行动能力的不足,提出了Can-Do数据集,通过更复杂的场景评估具身规划能力。我们还提出了神经符号框架NeuroGround,以环境状态为基础生成计划,结合符号规划引擎增强模型产生的计划,实验结果显示该框架优于现有方法。