FastIF：面向高效模型解释和调试的可扩展影响函数

Dec, 2020

FastIF：面向高效模型解释和调试的可扩展影响函数

FastIF: Scalable Influence Functions for Efficient Model Interpretation and Debugging

Han Guo, Nazneen Fatema Rajani, Peter Hase, Mohit Bansal, Caiming Xiong

TL;DR通过引入 k - 最近邻算法、快速并行变量和逆 Hessian 向量积的配置，在不牺牲性能的情况下大大提高了影响函数的运行时间，从而为模型解释和纠正模型错误等领域提供了潜力。

Abstract

influence functions approximate the "influences" of training data-points for test predictions and have a wide variety of applications. Despite the popularity, their computational cost does not scale well with model and training data size. We present →

influence functions fastif model interpretation fine-tuning model errors

发现论文，激发创造

通过广义影响函数深入理解黑盒预测

通过使用广义的影响函数进行参数分析，并采用鲁棒的逆 - Hessian - 向量积逼近方法解决计算不稳定性，我们提出了一种可在各种人工智能领域中用于模型分析的多功能工具。

Dec, 2023

影响函数的理论和实践视角

通过理论分析和实验测试，我们发现影响函数在现代深度神经网络中存在参数发散的局限性，但仍可用于模型调试和纠正误预测。

May, 2023

基于类别的影响函数用于错误检测

本文研究了影响函数在深度网络中不稳定的问题，并提出了一种基于类别信息的解决方案，经过大量实验表明我们的修改不仅显著提高了影响函数的性能和稳定性，而且不会带来额外的计算成本。

May, 2023

深度学习中的影响函数非常脆弱

本文举行了一项大规模实证研究，详细探究了影响函数在神经网络模型中的成功和失败，在浅层网络中影响估计值相对准确，在深层网络中影响估计值通常是错误的，特定的神经网络结构和数据集，训练时使用重量减退正规化很重要以获得高质量的影响估计。

Jun, 2020

分析使用影响力函数在神经机器翻译中进行特定实例数据过滤

文章研究了影响函数在神经机器翻译（NMT）中的应用，提出了两个有效扩展，并证明在处理复制训练示例等子问题时，影响功能可以更广泛地应用于 NMT。

Oct, 2022

利用影响函数研究大型语言模型的泛化能力

影响函数为我们研究 LLMs 的泛化特性提供了强大的新工具，通过使用 EK-FAC 逼近和算法技术来扩展影响函数，我们能够高效地获得有关机器学习模型中关键训练示例的见解，并揭示出泛化模式的稀疏性、尺度的增加和关键短语顺序翻转的限制.

Aug, 2023

对超参数区间中神经网络的影响函数的重新思考

本文利用神经切线核理论计算对于带拉格朗日正则化均方损失训练的神经网络的影响函数。通过理论分析，证明了在 ReLU 网络的两个层的宽度足够大时，误差可以任意小。此外，案例分析了 IHVP 方法在过度参数化区域的误差限制及其相关性。实验结果验证了理论分析的正确性。

Dec, 2021

InfFeed: 以影响函数作为反馈来提高主观任务的性能

使用影响函数改进深度神经模型的性能并自动识别需要手动校正的数据点来提高模型性能，达到减少手动标注数据点数量的效果。

Feb, 2024

DataInf: 在经过认证的 LLMs 和扩散模型中高效估计数据影响力

我们提出了 DataInf，一种高效的影响力近似计算方法，可用于大规模生成型 AI 模型。通过利用易于计算的闭合形式表达式，DataInf 在计算和内存效率方面优于现有的影响力计算算法。我们的理论分析表明，DataInf 特别适用于 LoRA 等参数效率高的微调技术。通过系统的实证评估，我们表明 DataInf 准确地近似了影响力分数，并且比现有方法快几个数量级。在 RoBERTa-large、Llama-2-13B-chat 和 stable-diffusion-v1.5 模型的应用中，DataInf 能够比其他近似影响力分数更好地识别出影响最大的微调示例，而且可以帮助识别出错误标记的数据点。

Oct, 2023

影响函数的扩张

本论文提出基于 Arnoldi 迭代方法的反 Hessian 矩阵计算，实现了首个能够扩展到拥有几亿参数的 Transformer 模型的成功影响函数实现，适用于图像分类和序列 - 序列任务。

Dec, 2021