Oct, 2024

时序差分变分持续学习

TL;DR本研究解决了持续学习中模型面临的塑性与记忆稳定性之间的平衡问题,特别是应对灾难性遗忘的挑战。通过引入新的学习目标,整合多次后验估计的正则化效果,研究揭示了与时序差分方法的深刻联系,从而在流行的持续学习基准测试中取得优于传统变分持续学习方法的显著成效。