BriefGPT.xyz
Ask
alpha
关键词
primitive skills
搜索结果 - 4
深度强化学习中的时序索引作为顺序操控任务的归纳偏差
通过顺序执行不同的动作头部来学习原始技能,我们提出了一种有助于完成操作任务所需的技能学习的策略结构,在 Metaworld 任务上的测试表明,这种简单的结构优于标准策略学习方法,突显了其改进技能获取的潜力。
PDF
6 months ago
基于语言知识的家庭活动迁移学习
此研究旨在通过迁移学习方法以及基于语言模型的状态空间共同嵌入来提高服务机器人从之前学习中寻找相似方法,以解决家庭服务机器人学习新任务精度低的问题。实验结果表明,基于语义相似性从众多源任务中选择相似任务是非常有效的,并且对于避免遗忘问题可以通
→
PDF
a year ago
流量控制:无损原始发现的离线强化学习
本研究提出了一种以基本技能表示为流的离线层次学习方法,重点在于保证基本技能的表达能力,从而恢复整个策略空间,实验结果表明,该方法在大多数任务中取得了优异的性能表现。
PDF
2 years ago
交互式机器人操作的混合组合推理方法
本文介绍了一种神经符号 (混合) 组合推理模型,以将语言引导的视觉推理与机器人操作相结合。该模型通过使用共享的原始技能库以任务非特定的方式处理所有情况。通过语言解析器将输入查询映射为由这些原语组成的可执行程序取决于上下文。结果表明,该方法达
→
PDF
2 years ago
Prev
Next