RelatIF: 通过相对影响力识别解释性训练样本

Mar, 2020

RelatIF: 通过相对影响力识别解释性训练样本

RelatIF: Identifying Explanatory Training Examples via Relative Influence

Elnaz Barshan, Marc-Etienne Brunet, Gintare Karolina Dziugaite

TL;DR本研究关注于利用影响函数来确定相关的训练样本，以期“解释”机器学习模型的预测，提出了一种基于全局和局部影响的相关性选择准则 RelatIF，并通过实证评估表明，与使用影响函数得到的结果相比，RelatIF 所返回的样本更加直观。

Abstract

In this work, we focus on the use of influence functions to identify relevant training examples that one might hope "explain" the predictions of a machine learning model. One shortcoming of →

发现论文，激发创造

基于示例解释的交互式标签清洗

Cincer是一种新的方法，它基于样本间的最大不兼容性来清洗数据，并使用Fisher信息矩阵的影响函数近似实现。该方法能发现在传统方法无法发现的已污染数据，并与过去数据一同进行清洗，可以显著提高数据和模型的质量。

Jun, 2021

语言数据影响上，先驱胜于追随

该研究针对NLP应用中大型模型在调试训练数据和解释模型行为时计算影响力的问题，提出了一种名为TracIn-WE的技术，该技术基于词嵌入层进行数据影响力分析，能够获得较高的影响力得分，可有效调试。

Feb, 2022

探究连续学习中的样本影响力

该研究提出MetaSP算法，用于控制模型更新并优化训练数据集的存储，该算法基于Influence Function通过计算加权示例对模型鲁棒性的影响，从而提高连续学习的稳定性和可塑性，实验结果展示其显著优于现有方法。

Sep, 2022

分析使用影响力函数在神经机器翻译中进行特定实例数据过滤

文章研究了影响函数在神经机器翻译（NMT）中的应用，提出了两个有效扩展，并证明在处理复制训练示例等子问题时，影响功能可以更广泛地应用于NMT。

Oct, 2022

Simfluence：通过模拟训练运行来建模个别训练示例的影响

提出了一种名为Simfluence的新方法，旨在通过训练运行模拟器而不是单独的影响得分来研究数据示例之间非线性相互作用。该方法能够预测大语言模型微调中的损失轨迹，并比现有TDA方法提高了预测准确性。

Mar, 2023

用最小的训练子集重新标记以改变预测结果

该研究利用扩展影响函数提出了一种有效的识别和重新标记最小训练样本以翻转给定预测的过程，评估模型的韧性，并提供有关训练集内偏差的见解。

May, 2023

论影响函数、分类影响、相对影响、记忆和泛化

本文从化简计算的角度研究影响函数，讨论了少量参数下实现影响计算的假设，并证明影响值的符号可以指示训练点是记忆还是泛化，结果表明，即使是大规模的机器学习系统，影响函数也是可操作的，并且可以通过选择性地删除培训点来计算影响值，作为学习过程的一部分。

May, 2023

影响函数的理论和实践视角

通过理论分析和实验测试，我们发现影响函数在现代深度神经网络中存在参数发散的局限性，但仍可用于模型调试和纠正误预测。

May, 2023

利用影响函数研究大型语言模型的泛化能力

影响函数为我们研究LLMs的泛化特性提供了强大的新工具，通过使用EK-FAC逼近和算法技术来扩展影响函数，我们能够高效地获得有关机器学习模型中关键训练示例的见解，并揭示出泛化模式的稀疏性、尺度的增加和关键短语顺序翻转的限制.

Aug, 2023

基于核化斯坦差异的数据中心预测解释

该研究论文提出了一种高度准确且以数据为中心的解释方法（HD-Explain），利用核化Stein差异（KSD）的属性，有效地识别为测试点提供最佳预测支持的训练样本，从而达到精细化解释、一致性和计算效率的需求，提供了一种简单、有效且稳健的预测解释方案。

Mar, 2024