关于捷径学习的基础

Oct, 2023

On the Foundations of Shortcut Learning

Katherine L. Hermann, Hossein Mobahi, Thomas Fel, Michael C. Mozer

TL;DR深度学习模型从数据中提取多种多样的特征，但这些特征的使用不仅取决于其预测能力（即特征如何可靠地指示训练数据标签），还取决于其可提取性（即特征从输入中容易提取或利用的程度）。研究表明，某些模型更喜欢使用某些特定的特征，例如纹理优先于形状，图像背景优先于前景对象。本研究通过构建一个具有预测性和可提取性差异的最小显性生成框架，并量化了模型的 Shortcut Bias（即过度依赖快捷特征而忽视核心特征的程度），从而系统研究了预测性和可提取性如何相互作用来影响模型的特征使用。实证结果表明，线性模型相对没有偏见，但引入具有 ReLU 或 Tanh 单隐藏层的模型则会产生偏见。最后，本研究还研究了在实际使用中，模型是如何在自然数据集中权衡预测性和可提取性，并发现了增加模型 Shortcut Bias 程度的可提取性操作。综上所述，这些发现表明，在深度非线性架构中学习快捷特征的倾向是一个基本特征，值得进行系统研究，因为它影响模型解决任务的方式。

Abstract

deep-learning models can extract a rich assortment of features from data. Which features a model uses depends not only on predictivity-how reliably a feature indicates train-set labels-but also on →

deep-learning models shortcut learning predictivity availability shortcut bias

发现论文，激发创造

针对自然语言理解模型的捷径学习行为进行解释和缓解

本文研究表明，NLU 模型倾向于依赖于快捷特征进行预测，而不是真正理解语言。我们发现 NLU 训练集中的单词可以被建模为长尾分布，进一步提出了一种量化每个训练样例快捷程度的方法，并基于此提出了一个缓解快捷特征对模型训练的影响的框架 LTGR，实验结果表明这种方法可以提高模型对 OOD 数据的泛化能力，同时保持在分布数据上的准确性。

Mar, 2021

DNNs 会选择哪些快捷提示？—— 基于参数空间的研究

本文介绍了一系列实验来深入理解深度神经网络中的快捷学习和其影响。作者设计了一种学习 WCST-ML 的训练过程，证明了在相同的机会下某些提示优先于其他提示，这可以通过 Kolmogorov 复杂度来解释。作者的研究基于 DSprites 和 UTKFace 数据集，强调了消除模型偏见的重要性。

Oct, 2021

深度神经网络的快捷学习

本文介绍深度学习中的 shortcut learning 问题，该问题用于在标准基准测试中表现良好的决策规则在更具挑战性的测试条件下失败，作者提出了一些模型解释和基准测试的建议，以改善从实验室到真实世界应用的稳健性和可迁移性。

Apr, 2020

什么塑造了特征表示？探索数据集、体系结构和训练

研究自然学习问题中的特征选择，发现训练后任务相关的特征增强，任务无关的特征部分抑制，容易的特征对模型具有更大的一致性和代表性，并且对未经训练的模型具有更大的相似性。

Jun, 2020

早期训练动态视角下的快捷学习

本文通过观察 Deep Neural Networks (DNNs) 内部神经元的学习动态，提出了易学特征会导致 Shortcut Learning 的假设，并用实验验证了此假设。文章主张在早期的训练动态中监测模型的表现而非仅仅监测模型准确率。

Feb, 2023

超越捷径：通过神经坍缩的视角进行无偏学习

本文探讨了神经塌缩（Neural Collapse）现象在不平衡属性的偏倚数据集中的影响，提出了一种避免捷径学习的框架，通过设计神经塌缩结构的快捷方式引导模型，以捕捉内在的相关性，从而解决了偏倚分类的根本原因，实验证明该方法在训练过程中具有更好的收敛性能并在综合和真实世界的偏倚数据集上实现了最新的泛化性能。

May, 2024

图像和文本的自监督减少对视觉快捷特征的依赖

本文研究了深度学习模型中的 shortcut 特征在测试或部署时可能会产生的问题，提出了自我监督方法可以提高图像表示的健壮性和降低模型对 shortcut 特征的依赖，特别是在医学成像领域中具有一定的应用前景。

Jun, 2022

公正视觉识别的良性快捷方式：通过快捷特征介入进行去偏

机器学习模型中，为了解决与种族和性别等社会属性相关的公平性风险问题，我们提出了一种名为 "Shortcut Debiasing" 的方法，通过设计控制性的替代特征来代替偏见特征，在训练阶段利用这些特征来提高目标任务的学习，并在推断阶段通过干预来消除这些特征，从而在准确性和公平性方面实现了显著改善。

Aug, 2023

自监督表示学习的自动快捷方式移除

自我监督视觉表示学习中，通过预训练任务训练特征提取器，提出了使用 lens 网络来减少对抗攻击漏洞，通过对图片进行微小修改，最大限度地减少了自我监督学习中的 “捷径” 特征的影响。

Feb, 2020

问答模型更喜欢学习哪种快速解决方案？

研究发现，QA 模型学习步骤通常倾向于学习 shortcut solutions 而非 QA 数据集所期望的解题方法，而学习 shortcut solutions 的行为扰乱了 QA 模型在 anti-shortcut examples 上的泛化能力。研究人员提出利用 shortcut solutions 的可学习性来设计 QA 训练集，以降低 shortcut solutions 的学习程度，从而提高 QA 模型的准确性。

Nov, 2022