ICLRJul, 2022

强化学习中的表示时间解耦以提高泛化能力

TL;DR通过引入时间分离(TED)作为强化学习辅助任务,可以更好地利用序列化 RL 观察结果,学习更健壮的表示形式,从而使 RL 算法对未知环境变量的变化更快地适应。