Feb, 2021

辅助任务对表示动态的影响

TL;DR本文研究了在稀疏奖励环境中,如何通过分析时间差分算法的动态来建立转移算符的谱分解和各种辅助任务诱导的表示之间的联系,并利用这些理论结果来选择深度强化学习代理的辅助任务。