探究连续学习中的样本影响力

Sep, 2022

Exploring Example Influence in Continual Learning

Qing Sun, Fan Lyu, Fanhua Shang, Wei Feng, Liang Wan

TL;DR该研究提出 MetaSP 算法，用于控制模型更新并优化训练数据集的存储，该算法基于 Influence Function 通过计算加权示例对模型鲁棒性的影响，从而提高连续学习的稳定性和可塑性，实验结果展示其显著优于现有方法。

Abstract

continual learning (CL) sequentially learns new tasks like human beings, with the goal to achieve better stability (S, remembering past tasks) and →

continual learning stability plasticity influence function metasp

发现论文，激发创造

存在假相关性情况下的持续学习

本文研究了连续学习中数据集偏差对模型知识迁移的影响，并通过设计实验证实了标准 CL 方法会将偏差从一个任务传递到另一个任务，而提出的 Group-class Balanced Greedy Sampling（BGS）插件能有效地解决这一问题。

Mar, 2023

论影响函数、分类影响、相对影响、记忆和泛化

本文从化简计算的角度研究影响函数，讨论了少量参数下实现影响计算的假设，并证明影响值的符号可以指示训练点是记忆还是泛化，结果表明，即使是大规模的机器学习系统，影响函数也是可操作的，并且可以通过选择性地删除培训点来计算影响值，作为学习过程的一部分。

May, 2023

具有影响力的上下文示例选择

本文通过使用 in-context 影响性分析 few-shot in-context learning 性能，提出了基于影响的示例选择方法，该方法在 10 个 SuperGlue 任务上优于大多数基线，并且随着 k-shot 的增加而稳定扩展。分析发现最积极和最消极的示例之间的性能差距高达 22.2％。在案例研究中，我们应用影响力框架来量化 few-shot in-context learning 中的近期偏差现象。

Feb, 2023

让每个样本都有价值：自我影响在学习嘈杂自然语言处理数据中的稳定性与效用

本文研究使用任务不可知的自我影响分数对训练数据进行清洗的有效性，通过分析其在捕捉自然异常值方面的功效来调查自我影响数据清洗对机器翻译、问答和文本分类等任务的改进程度，利用自我影响计算的最新方法和自动课程学习作为基础。

Feb, 2023

影响函数的理论和实践视角

通过理论分析和实验测试，我们发现影响函数在现代深度神经网络中存在参数发散的局限性，但仍可用于模型调试和纠正误预测。

May, 2023

用于分析持续学习者的新度量标准

在连续流数据的情景中，深度神经网络在解决多个分类任务时，面临着保持旧任务知识同时学习新任务的挑战。本研究分析了当前度量方法的局限性，发现了新任务引起的遗忘问题，并提出了一套考虑任务难度增加的新度量方法，实验证明这些度量方法能够提供有关模型在连续学习环境中平衡稳定性和可塑性的新见解。

Sep, 2023

InfFeed: 以影响函数作为反馈来提高主观任务的性能

使用影响函数改进深度神经模型的性能并自动识别需要手动校正的数据点来提高模型性能，达到减少手动标注数据点数量的效果。

Feb, 2024

双重扰动的无任务持续学习

通过考虑未来样本和注入敌对扰动，我们提出了一种新的 TF-CL 框架，并通过在输入数据和决策过程中注入敌对扰动的方法实现了这一框架，通过采用记忆管理方案和学习率调度进一步提高性能。

Dec, 2023

运用经验影响函数理解微调的逻辑

通过精调来衡量神经网络的学习能力，研究发现常用模型在泛化和逻辑推理方面存在缺陷。

Jun, 2024

利用影响函数研究大型语言模型的泛化能力

影响函数为我们研究 LLMs 的泛化特性提供了强大的新工具，通过使用 EK-FAC 逼近和算法技术来扩展影响函数，我们能够高效地获得有关机器学习模型中关键训练示例的见解，并揭示出泛化模式的稀疏性、尺度的增加和关键短语顺序翻转的限制.

Aug, 2023