May, 2023

基于地图的经验回放:强化学习中灾难性遗忘的一种内存高效解决方案

TL;DR该研究采用基于心理认知的重新记忆策略,通过构建一个基于地图的经验重播存储库,减少了记忆体的大小,并增加了样本之间的相关性,从而有效地解决了深度增强学习代理在处理新数据时可能出现的忘记先前解决方案的问题。