BriefGPT.xyz
Ask
alpha
关键词
offline demonstrations
搜索结果 - 3
DiffClone: 强化行为克隆机器人中的扩散驱动策略学习
本文介绍了一种使用离线演示数据集进行训练的增强行为克隆代理的离线算法 DiffClone,并在真实在线物理机器人上测试了该方法的有效性。
PDF
6 months ago
深度强化学习自适应路径约束的探索策略
提出了一种用于深度强化学习的高效适应性轨迹约束探索策略,利用不完整的离线演示作为参考,引入了一种新的基于策略梯度的优化算法,为单智能体和多智能体强化学习提供了一种自适应剪切轨迹距离奖励的方法。通过对两个大型二维网格世界迷宫和几个 MuJoC
→
PDF
6 months ago
视觉模仿的简易实现
本研究提出了一种基于商用机械臂的可行的、简化了数据收集过程的、能够有效采集各种复杂场景演示数据的人机互动界面,并采用了多项数据增强技术来优化模型的学习性能,最终在非捏取推动和物品堆叠等任务中获得了较高的成功率。
PDF
4 years ago
Prev
Next