深度神经网络的可预测外推倾向

Oct, 2023

Deep Neural Networks Tend To Extrapolate Predictably

Katie Kang, Amrith Setlur, Claire Tomlin, Sergey Levine

TL;DR神经网络预测在面对越来越多的分布外数据时，往往呈现出不可预测和过度自信的特点。然而，我们的研究发现，与其任意拟合，神经网络预测往往趋向于一个恒定值，并且这个值通常接近于最优恒定解（OCS），即在没有观察到输入时最小化训练数据平均损失的预测。我们在 8 个包含不同分布转移的数据集（包括 CIFAR10-C 和 ImageNet-R,S）、不同损失函数（交叉熵、均方误差和高斯负对数似然）以及不同架构（CNN 和转换器）上展示了这种现象。此外，我们提出了这种行为的解释，首先通过实证研究验证，然后在简化的深度均质网络和 ReLU 激活的环境中进行理论研究。最后，我们展示了如何在面对分布外输入时利用我们的发现在实践中实现风险敏感的决策。

Abstract

Conventional wisdom suggests that neural network predictions tend to be unpredictable and overconfident when faced with out-of-distribution (OOD) inputs. Our work reassesses this assumption for neural networks with high-dimensional inputs. Rather than extrapolating in arbitrary ways, w

neural network predictions out-of-distribution inputs constant value optimal constant solution risk-sensitive decision-making

发现论文，激发创造

预防在点估计判别神经网络中对远离数据的任意高自信度

通过在神经网络输出中添加额外类别的逻辑回归值，我们解决了过度自信并提高对边界测试数据的性能表现。

Nov, 2023

可证明鲁棒性的无需付出昂贵代价的异常检测

研究使用机器学习技术的安全关键系统需要可靠的不确定性评估。本研究发现，深度神经网络在处理分布外数据时可能会产生过度自信的预测。本研究提出了一种具有保护分布外数据和高准确度的分类器，并提供所有实验代码。

Jun, 2021

使用早期层输出在深度神经网络中检测超范围输入

本研究提出了一种新的的基于输出层的单类分类器方法用于检测深层分类器中的异常值输入，该方法无需访问 OOD 样本且在低维和高维数据集上表现出优异的性能指标。

Oct, 2019

通过捕捉极端激活来减轻对于外部分布检测中的过度自信

通过测量神经网络次最后一层的极端激活值并利用这一特征改进各种 OOD 检测基线，我们解决了模型 “过度自信” 现象造成的 OOD 检测问题，在各类实验中得到了显著提升，不损害任何场景的性能。

May, 2024

处理图上的分布偏移：一个不变性的视角

本文提出了一种基于不变性学习和风险最小化的方法，实现图神经网络对于图结构数据上的越域通用性问题进行预测和预测不确定性的估计。

Feb, 2022

自信度分类器用于异常检测的分析

本文针对图像分类中的 ODD 问题，分析研究了最近提出的使用置信分类器来检测 ODD 样本的方法，并结论表明该方法仍会对偏离训练数据分布的 OOD 样本产生高置信度，建议新增 “拒绝” 类别来训练分类器。

Apr, 2019

神经网络的鲁棒性外部分布检测

本文主要研究深度学习模型在检测 in-distribution 和 OOD inputs 时受到极小对抗扰动的影响，并提出了一种名为 ALOE 的有效算法，该算法通过将模型暴露于经过对抗训练的 inlier 和 outlier examples 中的方式，可以灵活地与现有方法相结合，提高现有的 Out-of-distribution detection 方法的鲁棒性，CIFAR-10 和 CIFAR-100 数据集的 AUROC 分别提高了 58.4% 和 46.59%。

Mar, 2020

构建神经网络：确保神经网络知道它们不知道的领域

本文提出了一种新的方法以应对激活函数为 ReLU 的神经网络在数据训练远离时会过度自信并有可能失去安全性的问题，该方法可以提供数学上的低置信预测同时提供第一个在一个分布外点附近的低置信预测的证书。实验表明，该方法能够在保留 OOS 性能的同时，保证其性能。

Sep, 2019

证明对抗性强鲁棒性的越界数据检测

本文旨在通过使用区间界传播 (IBP) 来确保拥有可证明的最坏情况保证 (out-of-distribution detection)，该技术不仅在 OOD 点处实现低置信度，还在一个 l∞球的周围实现低置信度。实验结果表明，相比于认证对抗性鲁棒性，最坏情况 OOD 检测的认证保证是可以在不损失太多精度的情况下实现的。

Jul, 2020

人工智能中的不确定性：对离群样本图像评估深度神经网络

该研究以深度神经网络模型为对象，研究了其在处理异常情况（如分布外或扰动数据）时的不确定性。研究通过实验证明，使用预训练模型进行分类对于异常图像表现良好，基于概率平均的集成模型能够进一步提高分类性能，而添加扰动会显著影响模型的鲁棒性，表明了人工智能模型的局限性。

Sep, 2023