ICLRJul, 2022
强化学习中的表示时间解耦以提高泛化能力
Temporal Disentanglement of Representations for Improved Generalisation in Reinforcement Learning
Mhairi Dunion, Trevor McInroe, Kevin Sebastian Luck, Josiah P. Hanna, Stefano V. Albrecht
TL;DR通过引入时间分离(TED)作为强化学习辅助任务,可以更好地利用序列化 RL 观察结果,学习更健壮的表示形式,从而使 RL 算法对未知环境变量的变化更快地适应。