无监督拒绝式异常检测
本文提出了一种基于奖励函数的混合策略,用于决定在多轮中分配标签预算以收集主动学习标签或学习拒绝标签,以优化异常检测性能。应用于 18 个基准数据集,结果表明该策略优于基线方法。
Jan, 2023
本文针对无标签数据集的异常检测问题,提供了一种基于三类代理度量(prediction error,model centrality 和 performance on injected synthetic anomalies)的度量组合方法, 将多个非完美代理度量聚合成一个健壮的排名,可以选择最符合数据集的异常检测模型,实验展示了该方法的有效性。
Oct, 2022
本文提出了两种基于 Excess-Mass 和 Mass-Volume 曲线的无监督异常检测算法评估指标,并介绍了一种基于特征子采样和聚合的方法扩展到高维数据集。
Jul, 2016
针对具有连续和无限目标空间的回归问题,提出了一种新颖的基于成本拒绝的回归模型,其可以通过考虑拒绝成本来拒绝对某些示例进行预测。该研究首先建立了该问题的期望风险模型,然后导出了贝叶斯最优解,表明当使用均方误差作为评估指标时,最优模型应拒绝对方差大于拒绝成本的示例进行预测。此外,提出使用考虑拒绝作为二分类的替代损失函数进行模型训练,并提供了模型一致性的条件,表明我们提出的替代损失函数可以恢复贝叶斯最优解。大量实验证明了我们提出方法的有效性。
Nov, 2023
本文综合研究了 12 个最流行的无监督异常检测方法,发现它们被评估时使用了不一致的协议,因此定义了一致的评估协议并用于比较它们在五个广泛使用的表格式数据集上的性能。尽管评估不能确定一种方法在所有数据集上优于其他方法,但它识别出那些突出表现的方法并修正了关于它们相对性能的错误认识。
Apr, 2022
本文使用元分析研究异常检测问题和方法,提供了大量异常检测基准数据和实验结果,分析了实验设计、指标和算法策略的影响,为异常检测问题提供了本体、方法、实验规范和未来研究的指导。
Mar, 2015
基于分类的方法在异常检测中十分有效,本论文提出了一种分布稳健的概率约束模型,利用核函数的方法来分类难以分离的数据集,并且在验证中显示了该模型的鲁棒性和优越性。
Dec, 2023
减小理论假设与实际训练数据之间的差距,并提出一个学习框架来改进正常性表示,通过识别样本的正常性,并在训练过程中迭代更新样本的重要性权重。还提出了终止条件,受到异常检测目标的启发。通过在多个受污染数据集上进行实验证明,该框架提高了三种典型异常检测方法的鲁棒性。
Sep, 2023
提出两种基于分类的半监督异常检测方法,一种基于无偏风险估计器的半监督浅层方法和一种利用非负偏向风险估计器的半监督深层方法,通过建立估计误差和风险过度界限来证明两者的有效性,并提出选择合适的正则化参数以确保浅层模型下经验风险非负性的技术。
Sep, 2023