BriefGPT.xyz
Ask
alpha
关键词
behaviour cloning
搜索结果 - 2
DiffClone: 强化行为克隆机器人中的扩散驱动策略学习
本文介绍了一种使用离线演示数据集进行训练的增强行为克隆代理的离线算法 DiffClone,并在真实在线物理机器人上测试了该方法的有效性。
PDF
6 months ago
将进化搜索与行为克隆相结合,用于程序生成内容
本文提出了一种将进化搜索和强化学习相结合的框架,通过行为克隆将演化的关卡序列提炼为策略,以生成更快速的关卡,我们将其应用于迷宫游戏和超级马里奥兄弟中,结果表明该方法能够显著缩短关卡生成的时间。
PDF
2 years ago
Prev
Next