局部最大值集合的无监督学习

Jan, 2020

Unsupervised Learning of the Set of Local Maxima

Lior Wolf, Sagie Benaim, Tomer Galanti

TL;DR本文介绍了一种新的无监督学习方法，用于处理无标记点集，并通过比较函数和判别器函数来提供互补的训练信号，使训练样本 x 成为未知函数 v 在局部最大值，实现异常检测任务并以完全无监督的方式提取了其他信号。

Abstract

This paper describes a new form of unsupervised learning, whose input is a set of unlabeled points that are assumed to be local maxima of an unknown value function v in an unknown subset of the vector space. Two

发现论文，激发创造

一种极小极大法用于监督学习

引入最大熵原理的一般化方法，应用于带有从数据中得出的经验边缘条件的分布集合，提出一种针对监督学习问题的通用minimax方法，其中最大熵机是一种新的最小化结构化分布中最坏情况0-1损失的线性分类器，并且通过实验表明可以优于其他线性分类器，同时证明了minimax方法中的泛化最坏情况误差保证的界限。

Jun, 2016

深度主动学习用于异常检测

介绍了一种基于深度学习的主动学习方法，可以有效地从正常数据中分离离群值，并讨论了它们在发现聚类和低密度异常方面的性能

May, 2018

从未标注的数据中以最少监督训练任何二元分类器

该研究通过使用两组未标记的数据和基于经验风险最小化（ERM）的方法，提出了一种可以训练任意（从线性到深度）二分类器的学习方法，并证明了这种方法是一致的；实验证明，该方法可以训练深度模型并优于学习两组未标记数据的现有方法。

Aug, 2018

通过预测随机距离进行无监督的表示学习

本研究提出了一种无监督学习方法，通过训练神经网络预测在随机投影空间中的数据距离来学习特征，并在19个真实世界数据集上的实证结果证明该方法显著优于几种最先进的竞争方法，尤其在异常检测和聚类任务中表现优异。

Dec, 2019

插值高斯描述符的深度单类分类

使用支持插值的高斯描述符，在一类分类（OCC）问题中实现了更好的异常检测性能和更好的鲁棒性。

Jan, 2021

实际数据上的无监督异常检测算法：我们需要多少个？

本研究在52个实际多元表格数据集上评估32种无监督异常检测算法，在收集的数据集中，K-thNN算法在大多数情况下表现最佳，也确定了两个清晰的簇，一个有“局部”数据集，另一个有“全局”数据集，考虑到算法的计算复杂性，这三种算法足以找到代表性的多元数据集中的异常。

May, 2023

AD-MERCS: 无监督异常检测中的正常性和异常性建模

本文提出了一种无监督方法AD-MERCS，旨在利用正常和异常模式来检测异常。该方法识别出多个子空间，以及识别出在这些模式之外的特征，能够对多种异常进行有效的检测，并能够通过在低维子空间中的模式和特征提供异常检测的简单解释。

May, 2023

基于风险估计的半监督分类的异常检测

提出两种基于分类的半监督异常检测方法，一种基于无偏风险估计器的半监督浅层方法和一种利用非负偏向风险估计器的半监督深层方法，通过建立估计误差和风险过度界限来证明两者的有效性，并提出选择合适的正则化参数以确保浅层模型下经验风险非负性的技术。

Sep, 2023

非可分二元分类及其在异常检测中的应用再思考

无法线性分类XOR激发了深度学习的很多研究。我们重新审视这个古老的问题并证明线性分类XOR是可能的。我们提出了一种稍微不同的范式，即等式分离，将SVM目标适应于区分数据在或超过边界之外。我们的分类器可以与神经网络流水线集成，并进行平滑逼近。根据其属性，我们直觉等式分离适用于异常检测。为了形式化这个概念，我们引入了封闭数字，这是对分类器形成封闭决策区域的容量的定量度量。基于这个二元分类与异常检测之间的理论联系，我们在监督异常检测实验中测试了我们的假设，结果显示等式分离可以检测到已知和未知的异常。

Dec, 2023

基于分类的神经网络最佳异常检测：理论与实践

本研究解决了无监督异常检测缺乏理论保障的问题，提出通过将其转化为二分类问题，建立了神经网络的额外风险的非渐近上界和收敛速率。研究发现，优化模型能够达到文献中最优的极小最大速率，同时提供了实现最佳性能所需的合成异常数量的界限。

Sep, 2024