Sep, 2022

在线持续学习的简单而强大的基线:重复增强训练

TL;DR本论文重新审视了在线学习中排挤记忆(rehearsal)动态。我们从偏差和动态经验风险最小化的角度提供了理论见解,并检查了重复练习的优点和局限性。受我们的分析启发,设计了一个简单直观的“重复增强排挤(Repeated Augmented Rehearsal,RAR)”基线,以解决在线排练的欠拟合和过拟合问题。该论文还展示了RAR在学习轨迹中成功实现了对过去数据损失景观和高损失梁脊的准确近似。我们通过广泛的消融研究研究了重复和增强练习之间的相互作用,同时应用强化学习(RL)来动态调整RAR的超参数,以在线平衡稳定性-可塑性权衡。