Jun, 2024
自我预测何时有帮助?理解增强学习中的辅助任务
When does Self-Prediction help? Understanding Auxiliary Tasks in Reinforcement Learning
Claas Voelcker, Tyler Kastner, Igor Gilitschenski, Amir-massoud Farahmand
TL;DR我们研究了辅助学习任务对强化学习中的表示学习问题的影响,包括观测重建和潜在自预测,并研究它们如何与干扰项和观测函数在 MDP 中交互。