Jun, 2024

自我预测何时有帮助?理解增强学习中的辅助任务

TL;DR我们研究了辅助学习任务对强化学习中的表示学习问题的影响,包括观测重建和潜在自预测,并研究它们如何与干扰项和观测函数在 MDP 中交互。