ICLRApr, 2022

理解和防止增强学习中的能力损失

TL;DR本文研究深度强化学习中的一种现象 —— 容量丧失,提出 Initial Feature Regularization(InFeR)算法,该算法可以有效缓解容量丧失并显著提高稀疏奖励任务中的性能表现。