Oct, 2023

重访视觉强化学习中的可塑性:数据、模块和训练阶段

TL;DR基于神经网络的高性能、高效样本视觉增强强化学习的主要研究领域之一是塑性。本研究通过系统性实证研究揭示了数据增强、评论者的塑性损失、塑性恢复等关键组成部分对塑性的影响,并提出了一种基于评论者塑性水平动态调整回放率来解决高回放率困境的策略,该策略在早期避免了塑性损失,并在后期重用更频繁的情况下提高样本效率。