Aug, 2023

通过再生规范化维持可塑性

TL;DR通过将 L2 正则化引入损失函数实现的 L2 Init 方法,在持续学习中保持可塑性,处理非稳态数据流时有效,减少参数大小并维持高的特征级别。