通过结合现有的事后方法改善离群检测
本文研究了如何检测机器学习模型移植到实际应用中可能出现的数据分布偏移,提出了一个以神经网络为基础的OOD检测方法,并结合理论与实验表现对其进行了分析与评估。
Dec, 2021
本文旨在识别常见的目标,以及识别不同OOD检测方法的隐含评分函数。我们展示了许多方法在共享学习方式下表现相似,二进制区分器达到与异常暴露相似的OOD检测性能,还展示了置信度损失具有在理论上最优得分函数不同但与训练和测试out-distribution相同时的函数相似的隐含评分函数,从实践中发现,这些方法训练方式一致时都表现相似。
Jun, 2022
提出了一种新的基于神经元分析的方法,Leveraging Important Neurons (LINe),通过使用Shapley值剪枝和激活截断等方法实现后置OOD检测。在CIFAR-10,CIFAR-100和ImageNet测试数据上,该方法表现出比其他现有后置OOD检测方法更高的有效性。
Mar, 2023
使用ExCeL模型结合极端信息和集合信息,提高了在预测时对于认知外数据(OOD)检测的准确性,并在CIFAR100和ImageNet-200数据集上实现了最佳性能。
Nov, 2023
通过改进神经网络中OOD样本的检测和管理,我们引入了含有噪声滤波技术的OOD-R数据集,提高了数据质量和模型准确性,针对模型的过度自信问题,我们还提出了一种创新方法ActFun来改善特征提取的稳定性和减小特异性问题,从而更准确地估计OOD不确定性。
Mar, 2024
深度神经网络在各种技术和服务中得到越来越广泛的应用,但其容易受到来自训练集不同分布的样本的干扰,而常见的解决方法是使深度神经网络具备检测这种样本的能力。本文提出了一种基于ImageNet和Places365的全面评估标准,根据与训练集的语义相似性,将个别类别分为内部分布和外部分布,通过不同的技术确定哪些类别应被视为内部分布,得到具备不同性质的评估标准。不同的ODD检测技术在不同的评估标准下的实验结果表明,它们的有效性取决于所选择的评估标准,而基于置信度的技术在接近ODD样本上可能优于基于分类器的技术。
Apr, 2024
本文介绍了一种将离群分布检测评分无缝组合的通用方法,通过量化正态化将这些评分转化为p值,将问题转化为多变量假设检验,并使用元分析工具组合这些检验,从而得到具有巩固决策边界的更有效的检测器。通过实证研究,我们探索了不同类型的数据偏移对于数据的不同影响程度,结果表明我们的方法在各种离群分布检测场景中显著提高了整体鲁棒性和性能。值得注意的是,我们的框架在未来的检测评分开发中易于扩展,并且是这个领域中首个结合决策边界的方法。
Jun, 2024
本研究针对机器学习模型在测试时分布转变问题进行了深入分析,探讨了离散分布(OOD)检测与开放集识别(OSR)两个主要子领域。通过系统的实验评估,发现这两者之间存在强关联,并提出一个新的基准设定,为研究者提供了针对OOD与OSR的有效实践指导。
Aug, 2024
本研究针对机器学习模型在测试时的分布转移问题进行了深入分析,特别是分布外检测和开放集识别两个领域。通过对现有方法的严格交叉评估,我们发现它们之间存在显著的性能相关性,并提出了一个新的基准设置,以更好地解耦这两个问题。研究结果表明,传统多项基准中表现最好的方法在大规模测试时存在困难,而对深度特征大小敏感的评分规则显示出一致的潜力,指明了未来研究的方向。
Aug, 2024