提高离群值检测的效率生成隐藏离群值
本文提出了一种可以通过生成异常样本来解决少数异常样本数据不均衡的方法,利用自编码器和变分自编码器的双层分层潜空间表示来将合法数据的特征描述符深度提取为更强的表示,再利用这些生成器合成未见过的负样本,训练二元分类器以获得鲁棒的且无需实际异常样本训练的异常检测性能,该方法在多个异常检测基准测试中表现优异。
Oct, 2020
本文提出了一种名为 BORE 的方法,将非监督得分函数用于监督学习框架中的特征,以解决在大数据集中检测少量异常值的问题,并在 12 个真实世界数据集上展示了其优越性。
Jul, 2015
本文提出了一个基于单目标生成对抗主动学习(SO-GAAL)方法的新型离群点检测算法,通过多个生成器(MO-GAAL)解决数据稀疏性和模式崩溃等问题,在合成和真实数据集上的实验结果表明,MO-GAAL 在各种情况下表现良好。
Sep, 2018
本文提出了一种名为 stray 的算法,使用基于极值理论的方法计算异常值阈值,针对 HDoutliers 算法的局限性进行改进,可以在准确性和计算时间上优于 HDoutliers 算法,对于数据结构中存在的异常值,使用特征工程进行检测,已在开源 R 包 stray 中实现。
Aug, 2019
在存在异常值和误设测量模型的状态空间模型的在线滤波中,我们导出了一种新颖、可靠证明的闭合贝叶斯更新规则。我们的方法将广义贝叶斯推理与滤波方法(如扩展和集成卡尔曼滤波器)相结合,其中前者用于展示鲁棒性,后者用于确保非线性模型的计算效率。在异常值测量的一系列滤波问题(如物体跟踪、高维混沌系统的状态估计和在线神经网络学习)中,我们在更低的计算成本下与其他鲁棒滤波方法(如基于变分贝叶斯的方法)相匹配或表现更好。
May, 2024
提出了一种新的贝叶斯分析方法,其在数据中有很强的鲁棒性,通常比传统方法具有更好的计算性能。该方法将数据分成非重叠的子组,评估每个独立子组得到的后验分布,然后组合结果。该方法的主要创新点是提出了一个基于概率度量空间中中位数的聚合步骤,提出了一种适合于快速高效评估的距离集合。我们提供了理论和数值测试结果,展示了我们的方法所取得的改进。
Mar, 2014