robot policies | BriefGPT - AI 论文速递

关键词robot policies

搜索结果 - 5

THE COLOSSEUM: 机器人操作泛化评估基准
为了实现有效的大规模、实际应用的机器人，我们必须评估我们的机器人策略对环境条件变化的适应能力。我们介绍了一个新的模拟基准测试 COLOSSEUM，它包括 20 个不同的操作任务，能够系统地评估模型在 12 个环境扰动轴上的性能。我们比较了
PDF5 months ago
通过语言修正提炼和检索机器人操作的泛化知识
通过 Distillation and Retrieval of Online Corrections (DROC) 这个基于大型语言模型（LLM）的系统，我们展示了一种能够回应任意形式的语言反馈、从纠正中提取通用知识以及基于文本和视觉相似
PDF8 months ago
通过交互畸变实现单次模仿学习
提出新方法 Interaction Warping 以形态扭曲技术学习单个演示的 SE (3) 机器人操作并演示其在三个目标重新排列任务中的表现，并证明在野外环境中其具有预测对象网格和机器人抓握的能力。
PDFa year ago
SPRINT：可伸缩的策略预训练，通过语言指导的标签化
SPRINT 提出了一种可扩展的离线策略预训练方法，通过使用大规模语言模型和离线强化学习，自动扩展预训练任务集合以训练机器人一系列技能，实验结果表明，SPRINT 预训练明显加速了机器人学习新任务的速度。
PDFa year ago
在线偏好中的积极奖励学习
为了实现机器人在不同环境和人类偏好中的适应性，本研究提出了在线稀疏二元偏好查询的方法，通过设计查询和决定何时呈现查询来最大化查询结果的信息价值，从而使得机器人能够快速适应实际应用场景并减轻人类专家的负担，在模拟，人类用户研究和真实机器人实验
PDFa year ago