AAAIDec, 2023

如何解决超出分布检测的维度诅咒?

TL;DR机器学习模型在野外部署时可能会受到未知类别的离群数据的挑战。最近对 OOD 检测的进展依赖于距离度量,以区分相对于内部分布数据而言相对较远的样本。尽管有前景,但基于距离的方法可能受到维度灾难问题的困扰,从而限制了在高维特征空间中的功效。为解决这个问题,我们提出了一种新颖的框架 Subspace Nearest Neighbor(SNN)用于 OOD 检测。在训练中,我们的方法通过利用最相关的子维度(即子空间)来规范化模型及其特征表示。子空间学习产生了 ID 和 OOD 数据之间高度可区分的距离度量。我们提供了全面的实验证明 SNN 的有效性。与当前最佳的基于距离的方法相比,SNN 在 CIFAR-100 基准测试中将平均 FPR95 降低了 15.96%。