BriefGPT.xyz
Ask
alpha
关键词
robotic control tasks
搜索结果 - 2
CRISP: 层次强化学习中课程引导的基本原语子目标预测
本文提出了一种新的分层算法,通过生成可实现的子目标的课程来训练逐层递进的策略,通过在少量专家演示中使用基础解析方法进行数据重标注,得到了可以用于多数机器人控制任务的适用的逐层递进的强化学习算法,实验结果表明,课程学习可以显著提高分层强化学习
→
PDF
a year ago
ICLR
可变循环模型求解部分可观测控制任务
本文提出了一种在部分可观察环境下应用深度强化学习解决机器人控制任务的算法,该算法包含了两个部分,即可变循环模型和强化学习控制器;实验证明,该算法比其他方法在数据效率和策略学习上表现更好。
PDF
5 years ago
Prev
Next