知识复苏：通过结构化训练实现对灾难干扰的预期恢复

Mar, 2024

知识复苏：通过结构化训练实现对灾难干扰的预期恢复

Reawakening knowledge: Anticipatory recovery from catastrophic interference via structured training

Yanlai Yang, Matt Jones, Michael C. Mozer, Mengye Ren

TL;DR我们研究了神经网络在结构化非独立同分布的设置中的训练动力学，其中文档以固定的重复顺序周期性呈现。我们发现了一个有趣而引人注目的 LML 在此设置中顺序微调的性质：它们表现出预期的行为，在再次遇到文档之前从遗忘中恢复。这种行为出现并随着架构规模的增加而变得更加稳健。通过全面的实验证明和可视化，我们揭示了在结构化环境中过参数化网络的训练中的新见解。

Abstract

We explore the training dynamics of neural networks in a structured non-iid setting where documents are presented cyclically in a fixed, r

neural networks structured non-iid catastrophic interference anticipatory behavior training dynamics

发现论文，激发创造

面向终身学习训练循环神经网络

本篇研究论文围绕序列监督学习中的参数化终身学习系统中的主要挑战 —— 灾难性遗忘和容量饱和进行了研究，并提出了一种基于课程的简单明了的评估标准，用于在不断增加难度的任务上对模型进行训练和测试。研究提出了两个网络模型 Gradient Episodic Memory 和 Net2Net，将它们统一起来，并将其应用于递归神经网络，验证了这种方法在终身学习环境中的适用性。

Nov, 2018

神经网络中的灾难性遗忘问题

研究了神经网络模型中遗忘问题的解决办法并提出了一种基于学习速率调整方法的连续学习模型，实现了在多个任务上获取并保留专业知识的能力。

Dec, 2016

减缓长短期记忆网络的灾难性遗忘

本文研究在序列数据上的持续学习问题，重点讨论了 LSTM 网络的遗忘和多任务学习问题，并提出了两种有效的解决方案，证明了这种方法比现有的权重正则化方法更为简单、高效，可应用于计算机系统优化和自然语言处理等领域。

May, 2023

神经发生在克服灾难性遗忘中的作用

本文研究表明，相较于静态网络，动态生长的神经网络在增量学习场景中表现更好，无监督学习使得训练更具挑战性，同时增加了研究的现实性，同时结构可塑性是防止非静态环境中的灾难性遗忘的有效方法。

Nov, 2018

利用上下文相关门控和突触稳定缓解灾难性遗忘

通过添加上下文依赖的门控信号，使得只有稀疏且大多非重叠的单元模式在任何一个任务中处于活动状态，从而稳定 ANN 的连接权重，以减轻灾难性遗忘。该方法易于实施，计算开销小，并且在与权重稳定相结合情况下能够使 ANN 在大量顺序呈现的任务中保持高性能，这些工作提供了另一个神经科学启发的算法如何有益于 ANN 设计和能力的例子。

Feb, 2018

利用任务硬注意力克服灾难性遗忘

本文提出了一种基于任务的硬注意机制，利用随机梯度下降学习硬注意掩码来保留上一个任务中的信息而不影响当前任务的学习，有效提高神经网络在顺序学习能力上的性能。此方法对不同超参数的选择也具有鲁棒性，并且具有控制学习知识稳定性和紧凑性等特点，在在线学习或网络压缩应用中也是吸引人的。

Jan, 2018

学会成长：应对灾难性遗忘的连续结构学习框架

本文提出了一个用于处理深度神经网络中的灾难性遗忘问题的概念简单、通用且有效的框架，通过优化神经结构和参数学习等两个组件，不仅可以直观有意义地演化神经结构，而且在实验证明了该方法具有很强的缓解灾难性遗忘问题的能力，此方法在连续学习的设置下，优于 MNIST、CIFAR100 和 Visual Domain Decathlon 数据集上的所有基线。

Mar, 2019

高效的非回忆式零遗忘连续学习：自适应权重调节

通过创建每个任务的任务特定调制参数来实现，我们的方法试图在确保不遗忘的同时，最大化新任务的性能。通过全面的实验评估，我们的模型在获取和保留对其他多任务模型而言困难的新任务方面表现出卓越的性能，从而强调了我们的方法在防止灾难性遗忘并适应新任务的获取方面的功效。

Nov, 2023

预训练在终身学习中的作用的实证调查

通过调查现有的方法及其在预训练模型上的表现，我们观察到 Generic Pre-training 方法隐含地减轻了多任务学习中遗忘现象的影响，因为预训练权重看起来通过导致更宽的极小值来缓解遗忘现象，基于这个发现，我们建议联合当前任务的损失和损失基底锐度的优化方法，以在顺序微调期间显式地鼓励更宽的基底，在多种设置中实现与最新技术的性能相当的顺序连续学习，而无需保留随任务数缩放的内存。

Dec, 2021

自然物理定律学习环境中的灾难性干扰被缓解

在自然学习环境中，我们评估了基于反馈的简单复习方法在类似人类面临的符合幂律分布的环境中减轻灾难性干扰的程度，并比较了其与其他基线方法的表现。

Jan, 2024