Dec, 2022
理解强化学习中的自预测学习
Understanding Self-Predictive Learning for Reinforcement Learning
Yunhao Tang, Zhaohan Daniel Guo, Pierre Harvey Richemond, Bernardo Ávila Pires, Yash Chandak...
TL;DR本篇研究探讨了自预测学习的学习动态,通过对优化动态的设计,提出了双向自学习算法,并通过一系列实验验证了该算法的有效性。