ICMLApr, 2018

层次强化学习的隐空间策略

TL;DR本文介绍了一种学习分层深度神经网络策略,通过最大熵强化学习目标训练各层解决任务,并通过潜在随机变量进行增广,从而实现多层次策略学习。对标准基准测试任务,通过增加多层,可以改善高层策略表现。对于简单低层次的目标,高熵技能的优化学习可以解决更复杂的稀疏奖励任务。