BriefGPT.xyz
Ask
alpha
关键词
goal representation
搜索结果 - 3
ICLR
协调空间和时间抽象以实现目标表征
通过引入空间和时间目标抽象的三层层次强化学习(HRL)算法提高目标表示性能,评估了该算法在复杂连续控制任务上学习到的空间和时间抽象的有效性以及遗憾边界的理论研究。
PDF
6 months ago
层次强化学习中的目标空间抽象通过基于集合的可达性分析
我们提出了一种通过紧密的表示来发现目标表示的发展机制,该机制可以将具有类似任务角色的环境状态集合抽象(即,分组在一起)。我们引入了一种 Feudal HRL 算法,该算法同时学习目标表示和分层策略。该算法使用神经网络的符号可达性分析来近似状
→
PDF
10 months ago
利用大型语言模型增强自我驱动智能体
本研究介绍了一种使用预训练语言模型(LM)的语言模型增强的自我目标学习环境,它支持自动生成并学习具有多样性、抽象性、与人类相关的目标 —— 而非手动编码的目标表示、回报函数或课程,该系统可以在基于文本的任务无关环境中学习掌握各种广泛的技能。
PDF
a year ago
Prev
Next