Aug, 2024

通过语言优化进行政策适应:对少样本模仿任务的分解

TL;DR本研究解决了学习的语言条件机器人策略在适应新实际任务时的低效问题。我们提出了一种名为PALO的创新方法,通过利用视觉-语言模型对任务分解的语义理解,结合少量示例和语言分解,实现快速的非参数适应。实验结果表明,PALO在长时限、多层次的任务中表现优越,超越了现有的状态下的预训练通用策略。