AI 代理的记忆和泛化能力分析：连续学习者是否稳健？

Sep, 2023

AI 代理的记忆和泛化能力分析：连续学习者是否稳健？

Analysis of the Memorization and Generalization Capabilities of AI Agents: Are Continual Learners Robust?

Minsu Kim, Walid Saad

TL;DR提出了一种新颖的连续学习（CL）框架，通过使用有限容量的内存保存先前观察到的环境信息以减轻遗忘问题，并从内存中采样数据点来估计环境变化的风险分布，从而获得对未知变化具有鲁棒性的预测器。实验表明，该算法在所有环境中优于基于内存的 CL 基线，并显著提高了在未知目标环境中的泛化性能。

Abstract

In continual learning (CL), an AI agent (e.g., autonomous vehicles or robotics) learns from non-stationary data streams under dynamic environments. For the practical deployment of such applications, it is importa

continual learning dynamic environments robust generalization memory-based cl unseen target environments

发现论文，激发创造

连续学习中的自适应记忆回放

基于丰富的记忆资源和训练效率的重视，我们引入了一种适应性记忆回放的框架来解决不断学习问题，通过多臂赌博机问题的方法来动态选择训练数据，从而在保持高性能的同时减少了遗忘达 10%。

Apr, 2024

自动化持续学习

通用学习系统应在不断变化的环境中以开放式方式不断改进自己。本文提出一种自动连续学习 (ACL) 的方法，通过训练自指神经网络来元学习其上下文中的连续学习算法，以解决传统神经网络学习算法中的 “上下文灾难性遗忘” 问题。ACL 有效地解决了这个问题，并且其学习到的算法表现优于手工设计的算法，在无回放设置下，在 Split-MNIST 基准测试上实现了持续学习多个少样本和标准图像分类数据集的目标。

Dec, 2023

自主机器人的持续学习：基于原型的方法

未来的自主智能机器人面临着从非重复稀疏数据流中学习、检测新颖性并具备无监督学习能力的挑战。本文通过提出一种名为 Continually Learning Prototypes (CLP) 的基于原型的方法，解决了这一挑战。CLP 在 FS-OCL 学习中表现出卓越的结果，在检测新颖性和无监督学习方面达到强基线水平。

Mar, 2024

不断学习，快速泛化：少样本学习的终身知识积累

该研究提出了一个新的学习框架 CLIF，可以在不断更新的多个 NLP 任务中提高模型的泛化能力，同时保留早期任务的表现，作者使用了多种方法对该框架进行了评估，并提出了一种新的适配器生成方法。

Apr, 2021

融合神经启发的适应性在人工智能中持续学习

通过建立一个稳定性与可塑性均衡、具有多个学习模块的学习系统，我们提出了一种通用方法，可以适度减弱旧记忆在参数分布中的影响，以提高学习可塑性，并通过协调多学习者架构确保解决方案的兼容性。经过大量的理论和实证验证，我们的方法不仅明显提高了持续学习的性能，尤其是在任务增量设置中超过了突触正则化方法，还可能推进神经适应机制的理解，成为推动人工智能和生物智能共同进步的新范例。

Aug, 2023

理想的持续学习者：一种永不遗忘的智能体

本文提出了一个新的永续学习框架 “理想永续学习器”(ICL)，其通过构造保证避免了灾难性遗忘。我们证明了 ICL 统一了多种现有的永续学习方法，并为这些方法的优缺点提供了新的理论见解。最后，我们将 ICL 与现代研究领域中的经典主题和研究课题联系起来，以期激发未来的研究方向。

Apr, 2023

强化连续学习

本论文提出了一种称之为强化连续学习的方法，该方法通过巧妙设计的强化学习策略为每个任务搜索最佳神经架构，不仅能够在防止灾难性遗忘方面有很好的性能，还能够适应新任务。在 MNIST 和 CIFAR-100 数据集的连续分类任务实验中，该方法优于现有的深度网络连续学习替代方案。

May, 2018

基于门控增量记忆的连续学习用于序列数据处理

提出基于循环神经网络（RNN）的连续学习模型，利用弹性权重合并法（EWC）处理输入分布的概念漂移，通过在两种不同类型的 RNN 之上实现和测试 EWC，比较了改进后的架构与 EWC 和 RNN 在标准连续学习基准测试中表现的差异，并高亮了需要专门解决 RNN 中的连续学习的问题。

Apr, 2020

神经网络中的持续学习

通过研究任务增量设置和在线连续设置，本文提出了一些方法以解决神经网络的严重遗忘问题，并在不同的基准测试和学习序列上进行了评估，显示了连续学习技术现在的发展和应用面临的挑战。

Oct, 2019

极限内存约束下的在线连续学习

本文提出了一个新的问题 ——Memory-Constrained Online Continual Learning (MC-OCL)，我们通过 Batch-level Distillation（BLD）这种基于正则化的 CL 方法来解决这个问题，并在三个公开的基准测试中证明了我们的方法成功地解决了 MC-OCL 问题，同时实现了与需要更高存储开销的先前 distillation 方法相当的准确性。

Aug, 2020