Mar, 2024

基于正则化的深度状态空间模型中的高效持续学习

TL;DR深度状态空间模型 (DSSM) 在动态系统建模方面的能力使其在近年来受到广泛关注。然而,现有 DSSM 方法仅适用于单任务建模,需要在重新访问之前的任务时使用历史任务数据进行重新训练。为了解决这个问题,我们提出了一种连续学习 DSSM (CLDSSM) 方法,它能够适应不断变化的任务而不会导致灾难性遗忘。我们的 CLDSSM 方法整合了主流的基于正则化的连续学习方法,确保以恒定的计算和内存成本对多个动态系统进行模型化的高效更新。我们还对各个连续学习方法应用于相应的 CLDSSM 进行了全面的成本分析,并通过在真实数据集上的实验证明了 CLDSSM 的有效性。结果证实,尽管各种竞争的连续学习方法各具特点,但所提出的 CLDSSM 在解决灾难性遗忘方面始终优于传统的 DSSM 方法,并能够实现对新任务的快速准确参数传递。