Oct, 2024

朝向可推广的视觉-语言机器人操作:基准测试和大型语言模型引导的三维策略

TL;DR本研究针对缺乏适当模拟基准测试的问题,提出了GemBench,一个新颖的基准,用于评估视觉-语言机器人操作策略的推广能力。通过3D-LOTUS和3D-LOTUS++方法,该研究实现了在GemBench上新任务的先进性能,设立了机器人操作领域的推广新标准。