BriefGPT.xyz
Ask
alpha
关键词
off-policy method
搜索结果 - 1
无监督离策略强化学习实现真实世界机器人技能
本文提出的无监督技能发现算法可用于进行高效无监督增强学习,通过模型预测控制将学习到的技能组合用于目标导航。
PDF
4 years ago
Prev
Next