弹性权重整合中的二次惩罚

Dec, 2017

On Quadratic Penalties in Elastic Weight Consolidation

Ferenc Huszár

TL;DR本文介绍了 Elastic weight consolidation (EWC) 算法，该算法是为了保护神经网络免受灾难性遗忘而设计的。该算法可以被视为 Laplace 传播的一种近似，但本文指出 EWC 中的二次惩罚与该推导不一致，可能导致对更早任务的数据重复计数。

Abstract

elastic weight consolidation (EWC, Kirkpatrick et al, 2017) is a novel algorithm designed to safeguard against catastrophic forgetting in neural networks. EWC can be seen as an approximation to →

elastic weight consolidation neural networks catastrophic forgetting laplace propagation quadratic penalties

发现论文，激发创造

弹性权重巩固以获得更好的偏差接种

使用 EWC 精细调优可以减轻训练数据集中的偏见，同时对于原始训练数据集的遗忘率较低。

Apr, 2020

EVCL: 弹性变分连续学习与权重巩固

弹性变分持续学习与权重保持的混合模型可以有效地缓解灾难性遗忘，并能更好地捕捉模型参数与任务特定数据之间的依赖关系。在五个可分辨任务上进行评估，该模型在领域增量和任务增量学习场景中持续优于现有基线模型。

Jun, 2024

使用弹性权重一致性进行神经机器翻译的无监督预训练

本文研究了神经机器翻译中的无监督预训练方法，使用 Elastic Weight Consolidation 对双向编码器和解码器进行初始化，通过 fine-tune 来避免原始语言建模任务的遗忘，并将其与以前的正则化工作进行比较，结果表明使用这种方法可以快速收敛而且不需要原始未标记的数据。

Oct, 2020

自适应权重巩固在连续学习中的应用

我们提出了一个自主进程的权重整合（spWC）框架，通过评估以前任务的辨别贡献，以实现鲁棒的连续学习。

Jul, 2023

基于弹性权重整合的情感分析顺序域自适应

提出了一个基于 Elastic Weight Consolidation 并基于上游任务信息的 Sequential Domain Adaptation 框架，来解决在不同领域上 sentiment analysis 同时训练时 catastrophic forgetting 的问题，并在实验中证明了该框架的有效性。

Jul, 2020

旋转您的网络：更好的权重合并和更少的灾难性遗忘

通过重新参数化神经网络中的 Fisher 信息矩阵，结合 Elastic Weight Consolidation 技术，实现解决序列任务学习中的灾难性遗忘问题，并在 MNIST、CIFAR-100、CUB-200 和 Stanford-40 数据集上进行实验证明，我们的方法明显改善了标准 Elastic Weight Consolidation 的结果，在不遗忘的连续任务学习中达到了同等竞争水平。

Feb, 2018

针对连续学习者的敌对后门攻击：有针对性地遗忘和制造虚假记忆

本文探究 EWC 算法对抗恶意攻击的漏洞，发现通过在训练中引入微小的错误信息，恶意攻击者能够逐步地、故意地让模型遗忘数据，从而掌控模型。我们展示了针对 MNIST 数据集不同变种的后门攻击，并证明只需要在不到 1% 的训练数据中注入恶意样本，即可轻松破坏神经网络的记忆。

Feb, 2020

在线学习中指数权重的多种表现形式

本文提出将指数加权法放在网络学习的中心地位，将标准方法和其遗憾界转化为适当的替代损失函数以及指数加权后验的结果，给出了在线梯度下降、在线镜像下降和在线牛顿步等方法的 EW 表述，并使得由复杂的自适应方法可转为简单易行的指数凸的代理损失函数。

Feb, 2018

Cued@wmt19:ewc&lms

该研究使用弹性权重整合和不同形式的语言建模技术，通过检查点平均和弹性权重整合优化先前 WMT 测试集的强基准线，并在基于改进的 Transformer 架构的文档级别 LM 和句子级别 Transformer LM 上获得进一步的增益。同时从 SMT lattices 中提取 n-gram 概率，可作为源条件的 n-gram LM。

Jun, 2019

冷启动免示例增量学习的弹性特征整合

Elastic Feature Consolidation (EFC) 通过对于 feature drift 的正则化，以及使用高度相关的方向和高斯原型来更新重要方向的特征漂移，成功解决了 Exemplar-Free Class Incremental Learning (EFCIL) 在 Cold Start 情景下的挑战，并在学习新任务时保持了模型的可塑性，明显优于最先进方法。

Feb, 2024