最近邻导引的带外分布检测

ICCVSep, 2023

Nearest Neighbor Guidance for Out-of-Distribution Detection

Jaewoo Park, Yoon Gyo Jung, Andrew Beng Jin Teoh

TL;DR检测开放环境中机器学习模型的异常样本是至关重要的。通过引入最近邻引导（NNGuide）方法，我们解决了由于边界几何导致的分类器评分过分自信的问题，同时保持了分类器评分的细粒度能力，并在多种设置下，包括 ID 数据自然分布变化的情况下，在 ImageNet 异常检测基准测试中取得了显著的性能提升，达到了 AUROC、FPR95 和 AUPR 指标的最佳结果。

Abstract

Detecting out-of-distribution (OOD) samples are crucial for machine learning models deployed in open-world environments. Classifier-based scores are a standard approach for ood detection due to their fine-grained detection capability. However, these scores often suffer from

out-of-distribution samples ood detection nearest neighbor guidance overconfidence issues imagenet ood detection

发现论文，激发创造

深度最近邻实现的超范围检测

本文研究使用非参数最近邻距离方法进行开放世界中一类重要任务：Out-of-distribution 检测，不同于先前的研究，该方法不施加任何分布假设，因此具有更强的灵活性和普适性，在多个基准测试中证明了其有效性，并且相对强基线的 Mahalanobis 距离方法，显著降低了 24.77% 误报率 (FPR@TPR95)。

Apr, 2022

分类器中的数据分布外检测 via 生成

本文中，我们通过研究生成 “有效” 的 OOD 样本的复杂性，分析了调整之前的方法的可行性。我们提出了一种使用流形学习网络（例如变分自编码器）生成这些样本的新算法，然后训练一个 $n+1$ 分类器来检测 OOD，其中第 $n+1$ 类代表 OOD 样本。我们在 MNIST 和 Fashion-MNIST 数据集上将我们的方法与几种最近的基于分类器的 OOD 检测器进行了比较，实验表明我们的方法总体上表现更好。

Oct, 2019

梯度正则化的离群样本检测

利用损失函数的梯度信息进行训练，实现神经网络在离分布数据上的检测，并通过能量采样方法提高模型性能。

Apr, 2024

持续无监督的外部分布检测

不断进行未标注 OOD 检测的新设置，使用融合 Mahalanobis 距离和最近邻方法的 U-OOD 评分函数，并设计了一种置信度缩放的少样本 OOD 检测器，大幅改善相关领域的强基准模型。

Jun, 2024

朝着外部分布检测的现实基准

深度神经网络在各种技术和服务中得到越来越广泛的应用，但其容易受到来自训练集不同分布的样本的干扰，而常见的解决方法是使深度神经网络具备检测这种样本的能力。本文提出了一种基于 ImageNet 和 Places365 的全面评估标准，根据与训练集的语义相似性，将个别类别分为内部分布和外部分布，通过不同的技术确定哪些类别应被视为内部分布，得到具备不同性质的评估标准。不同的 ODD 检测技术在不同的评估标准下的实验结果表明，它们的有效性取决于所选择的评估标准，而基于置信度的技术在接近 ODD 样本上可能优于基于分类器的技术。

Apr, 2024

如何解决超出分布检测的维度诅咒？

机器学习模型在野外部署时可能会受到未知类别的离群数据的挑战。最近对 OOD 检测的进展依赖于距离度量，以区分相对于内部分布数据而言相对较远的样本。尽管有前景，但基于距离的方法可能受到维度灾难问题的困扰，从而限制了在高维特征空间中的功效。为解决这个问题，我们提出了一种新颖的框架 Subspace Nearest Neighbor（SNN）用于 OOD 检测。在训练中，我们的方法通过利用最相关的子维度（即子空间）来规范化模型及其特征表示。子空间学习产生了 ID 和 OOD 数据之间高度可区分的距离度量。我们提供了全面的实验证明 SNN 的有效性。与当前最佳的基于距离的方法相比，SNN 在 CIFAR-100 基准测试中将平均 FPR95 降低了 15.96%。

Dec, 2023

在自然环境中训练 OOD 检测器

本文提出了一种基于野外混合数据的新颖框架，旨在改进在野外部署的机器学习模型的 OOD 检测能力，通过最大化 OOD 检测率并设定 ID 数据的分类误差和 ID 示例的 OOD 错误率的约束条件的学习目标，有效地解决了这个问题，并在常见的 OOD 检测任务中获得了优异的性能。

Feb, 2022

非监督式评估未知分布检测：一种数据为中心的观点

本文是关于检测外域异常的无监督评估问题，提出了三种方法计算 Gscore 作为指标，并且引入包含 200 个真实外域数据集的新基准 Gbench 用于评估。实验结果表明，Gscore 与异常检测性能有很强的定量相关性，并且本文方法表现出了最先进的性能。

Feb, 2023

贝叶斯不确定性估计在离域物体检测中的应用

基于预训练网络的提出高斯分布，通过权重参数抽样区分正常数据和超出分布的数据，证明我们的贝叶斯目标检测器在 BDD100k 和 VOC 数据集上的训练，并在 COCO2017 数据集上的评估中通过降低 FPR95 分数最多 8.19％和增加 AUROC 分数最多 13.94％来实现了令人满意的超出分布的辨别性能。

Oct, 2023

针对超出分布检测的可证明保障

本文研究了如何检测机器学习模型移植到实际应用中可能出现的数据分布偏移，提出了一个以神经网络为基础的 OOD 检测方法，并结合理论与实验表现对其进行了分析与评估。

Dec, 2021