Detecting out-of-distribution (OOD) data has become a critical component in
ensuring the safe deployment of machine learning models in the real world.
Existing OOD detection approaches primarily rely on the output or feature space
for deriving OOD scores, while largely overlooking info
研究发现,神经网络在训练分类数据集时,隐藏层特征的向量范数对于属于分布内的样本通常更高,而对于分布外的未知样本较低。解析神经网络中的中间层所隐藏的判别结构后,发现特征范数是网络层中的分类器隐藏的置信值,特征范数是一种类不可知的,可以检测各种判别模型下分布外样本的方法。然而传统的特征范数无法捕捉到隐藏层神经元的去激活倾向,可能会将分布内样本误识别为分布外实例。为了解决这个问题,提出了一种新的负向感知范数 (NAN),能够捕捉到隐藏层神经元的激活和去激活倾向。在 NAN 上进行了广泛的实验,证明了它的效果和与现有分布外检测器的兼容性,以及在无标签环境中的能力。