BriefGPT.xyz
Ask
alpha
关键词
robot policies
搜索结果 - 5
THE COLOSSEUM: 机器人操作泛化评估基准
为了实现有效的大规模、实际应用的机器人,我们必须评估我们的机器人策略对环境条件变化的适应能力。我们介绍了一个新的模拟基准测试 COLOSSEUM,它包括 20 个不同的操作任务,能够系统地评估模型在 12 个环境扰动轴上的性能。我们比较了
→
PDF
5 months ago
通过语言修正提炼和检索机器人操作的泛化知识
通过 Distillation and Retrieval of Online Corrections (DROC) 这个基于大型语言模型(LLM)的系统,我们展示了一种能够回应任意形式的语言反馈、从纠正中提取通用知识以及基于文本和视觉相似
→
PDF
8 months ago
通过交互畸变实现单次模仿学习
提出新方法 Interaction Warping 以形态扭曲技术学习单个演示的 SE (3) 机器人操作并演示其在三个目标重新排列任务中的表现,并证明在野外环境中其具有预测对象网格和机器人抓握的能力。
PDF
a year ago
SPRINT:可伸缩的策略预训练,通过语言指导的标签化
SPRINT 提出了一种可扩展的离线策略预训练方法,通过使用大规模语言模型和离线强化学习,自动扩展预训练任务集合以训练机器人一系列技能,实验结果表明,SPRINT 预训练明显加速了机器人学习新任务的速度。
PDF
a year ago
在线偏好中的积极奖励学习
为了实现机器人在不同环境和人类偏好中的适应性,本研究提出了在线稀疏二元偏好查询的方法,通过设计查询和决定何时呈现查询来最大化查询结果的信息价值,从而使得机器人能够快速适应实际应用场景并减轻人类专家的负担,在模拟,人类用户研究和真实机器人实验
→
PDF
a year ago
Prev
Next