BriefGPT.xyz
大模型
Ask
alpha
关键词
long-horizon goals
搜索结果 - 2
基于后继特征标志的长视程目标导向强化学习
本文介绍 Successor Feature Landmarks(SFL),它是用于大型、高维空间的探索的一个框架,该框架利用继承特征(SF)的能力来驱动探索,估计状态新颖性,并通过将状态空间抽象为基于非参数地标的图表,启用高级别规划,实现
→
PDF
3 years ago
可执行模型:无监督离线强化学习的机器人技能
本文提出了使用自回归进行离线机器人技能学习,并通过先前的数据学习环境的形式理解,该方法可以处理高维相机图像,可以学习到许多技能,并通过一系列技术进行训练,此方法具有较强的泛化能力,可以在多个目标之间进行目标链接,通过预训练或辅助目标学习到丰
→
PDF
3 years ago
Prev
Next