BriefGPT.xyz
Ask
alpha
关键词
multi-layer policies
搜索结果 - 1
ICML
层次强化学习的隐空间策略
本文介绍了一种学习分层深度神经网络策略,通过最大熵强化学习目标训练各层解决任务,并通过潜在随机变量进行增广,从而实现多层次策略学习。对标准基准测试任务,通过增加多层,可以改善高层策略表现。对于简单低层次的目标,高熵技能的优化学习可以解决更复
→
PDF
6 years ago
Prev
Next