COPOD: 基于 Copula 的离群值检测
本文提出了一种基于 Copula 的二阶段异常检测方法,以解决传统方法在透明度、可解释性和性能等方面存在的挑战,并在三个开源的 ICS 数据集中进行了实验验证,表现出优异的检测性能和计算效率,适合于低和高维度数据集的实时 ICS 异常检测。
Apr, 2023
本文提出了一种简单且有效的异常检测算法 ECOD,它是一种无参估计方法,通过计算数据的经验累积分布函数估计数据的尾部概率,进而计算每个数据点的异常得分。通过在 30 个基准数据集上的实验验证,我们发现 ECOD 在准确性、效率和可扩展性等方面均优于其他 11 种现有的异常检测方法。同时,我们还提供了易于使用、可扩展的 Python 实现,以保证算法的可访问性和可重复性。
Jan, 2022
提出一种新颖的基于后验采样的异常值挖掘框架(POEM),促进了异常数据的有效使用,并提高了识别内部和外部数据之间紧凑决策边界的性能,相对于现有最佳方法,在 CIFAR-10 和 CIFAR-100 上的 FPR95 相对性能分别提高了 42.0%和 24.2%,并在理论上证明了 POEM 用于 OOD 检测的有效性。
Jun, 2022
通过结合不同的出域检测 (OOD) 措施为一个组合出域检测 (COOD) 措施,本研究针对物种识别任务提出了一个能在大规模数据库中、大量的细粒度层级类别、严重的类别不均衡和不同图像质量下应用的框架。在大规模生物多样性数据集上对 COOD 进行了广泛评估,结果表明,在大多数实验中,COOD 在 TPR@1% FPR 方面的表现远优于单独的 OOD 措施,包括最先进的措施,例如,对于 iNaturalist 2018 数据集,COOD 将 ImageNet 图像(OOD)的检测率从 54.3% 提高到 85.4%。同时,研究还表明,不同的 OOD 措施对于各种任务都是必不可少的,因此需要多种 OOD 措施和组合以实现泛化。此外,作者还指出,明确考虑对于原始(物种)识别任务而言分类错误的 ID 图像对于构建高性能的 OOD 检测方法至关重要,并具有实际应用性。这个框架也可以轻松地扩展或适应到其他任务和媒体形式。
Mar, 2024
利用扩散模型的生成能力和 CLIP 的强大特征提取能力,我们提出了一种新颖的 OOD 检测方法,通过使用这些特征作为扩散模型的条件输入,我们可以在使用 CLIP 进行编码后重建图像。原始图像与重建图像之间的差异被用作 OOD 识别的信号,我们的方法不需要类别特定的标记,提高了实用性和可扩展性,且经过多个基准数据集的广泛实验证明了我们方法的鲁棒性和有效性。
Jun, 2024
该研究提出使用可解释 AI 领域的 PARTICUL 算法以构建更易解释、更具鲁棒性的视觉分类器的异常检测器,无需重新训练分类器,适用于缺乏明确定义的领域,并通过四个数据集和两个 OoD 定义的广泛基准测试证明了该方法的检测能力与现有方法相当,同时强调了分类器结构对鲁棒性的影响。
Jan, 2023
提出了一种名为 ODPC 的新方法,通过大型语言模型设计生成特定提示词来产生具有 ID 语义的 OOD 对等类,以便于检测,并采用基于 OOD 对等类的对比损失来学习紧凑的 ID 类别表示,并改善不同类别之间的界限清晰度。在五个基准数据集上进行的广泛实验表明,该方法可以得到最先进的结果。
Mar, 2024
本文旨在识别常见的目标,以及识别不同 OOD 检测方法的隐含评分函数。我们展示了许多方法在共享学习方式下表现相似,二进制区分器达到与异常暴露相似的 OOD 检测性能,还展示了置信度损失具有在理论上最优得分函数不同但与训练和测试 out-distribution 相同时的函数相似的隐含评分函数,从实践中发现,这些方法训练方式一致时都表现相似。
Jun, 2022
在存在外部样本时面临选择性分类问题的可靠预测模型的设计,我们提出了三个关键贡献。首先,我们证明最优的 SCOD 策略采用了贝叶斯分类器用于分布内数据和一个在二维空间表示为随机线性分类器的选择器,利用了分布内分类器的条件风险和分布内外数据的似然比作为输入,与当前的分布外检测方法和专门针对 SCOD 开发的 Softmax 信息保留组合(SIRC)方法的次优策略不同。其次,我们证明在一个无分布设置下,只依赖分布内数据样本时 SCOD 问题无法以近似正确学习。第三,我们引入了 POSCOD,一种简单的方法,从分布内数据样本和无标签的分布内外数据混合中学习最优 SCOD 策略的插件估计。我们的实证结果验证了理论发现,并证明我们提出的方法 POSCOD 在有效解决 SCOD 问题上优于现有的分布外方法。
Mar, 2024
我们提出了一种名为 PixOOD 的密集图像预测的离群检测算法,它不需要对异常数据样本进行训练,也不针对特定应用程序,避免了传统训练偏差。我们提出了一种在线数据压缩算法,用于在像素级别建模类内数据的复杂内部类变异性,该算法比标准 K-means 更强大,通过随机梯度下降(SGD)更容易训练。我们在多个问题上对 PixOOD 进行了评估,它在七个数据集中的四个上取得了最先进的结果,并在其余数据集上具有竞争力。源代码可在此 URL 处获得
May, 2024