Sep, 2024

基于可供性的机器人操控与流匹配

TL;DR本研究解决了助理机器人操控中的两个关键挑战:如何有效调整大规模模型以适应实际场景下的可供性理解任务,以及如何通过视觉可供性模型引导机器人轨迹的学习。我们提出了一种高效的提示调优方法,使冷冻的视觉模型能够在多任务场景中预测操控可供性,同时使用流匹配方法学习机器人轨迹,所得结果在日常生活活动中表现优异,且全面超越了其他调优协议,展示出显著的实用性和效率。