关键词block manipulation tasks
搜索结果 - 3
- LLM 增强分层代理
利用强化学习解决长期和拓展性任务很具挑战性,特别是在没有先验知识的情况下,为了提高样本效率,本文通过利用 LLMs 的规划能力结合强化学习的环境学习,构建了一个层次化代理,用于解决长期任务,并在 MiniGrid、SkillHack 和 C - 学习和复用原始行为以提高回顾经验重演的样本效率
采用前视经验回放(HER)技术,通过利用过去的经验来改进基于强化学习代理训练的目标导向机器人操作任务的采样效率,本文提出了一种使用先前学习的简单任务来引导代理在探索中选择更有益动作的方法。我们通过在多个块操纵任务中与 HER 和其他更高效变 - 一份 ACT 戏剧表演:单一演示行为克隆与行动分块变压器
使用行为克隆从单个人类示范中学习任务,通过使用线性变换增强单个示范来生成一系列初始条件广泛变化的轨迹,从而成功训练行为克隆智能体完成三个方块操作任务,并通过在推断期间将行动预测的标准差纳入集成方法中,使方法对环境中的意外变化更加稳健,从而实