ICLRSep, 2022

简化基于模型的强化学习:使用单一目标学习表示、潜空间模型和策略

TL;DR本研究提出了一种单一目标的方法,该方法同时优化隐空间模型和策略以实现高回报并保持自一致性,从而在提高样本效率的同时实现更好的强化学习效果。