Mar, 2023

使用本地遗忘的回放缓冲器进行自适应深度模型强化学习

TL;DR本文探讨了在深度强化学习中,如何使用改进后的 replay buffer 来解决 catastrophic forgetting 和 stale data 的问题,从而实现在环境变化时能够更加高效地应对。