局部最大值集合的无监督学习
引入最大熵原理的一般化方法,应用于带有从数据中得出的经验边缘条件的分布集合,提出一种针对监督学习问题的通用minimax方法,其中最大熵机是一种新的最小化结构化分布中最坏情况0-1损失的线性分类器,并且通过实验表明可以优于其他线性分类器,同时证明了minimax方法中的泛化最坏情况误差保证的界限。
Jun, 2016
该研究通过使用两组未标记的数据和基于经验风险最小化(ERM)的方法,提出了一种可以训练任意(从线性到深度)二分类器的学习方法,并证明了这种方法是一致的;实验证明,该方法可以训练深度模型并优于学习两组未标记数据的现有方法。
Aug, 2018
本研究提出了一种无监督学习方法,通过训练神经网络预测在随机投影空间中的数据距离来学习特征,并在19个真实世界数据集上的实证结果证明该方法显著优于几种最先进的竞争方法,尤其在异常检测和聚类任务中表现优异。
Dec, 2019
本研究在52个实际多元表格数据集上评估32种无监督异常检测算法,在收集的数据集中,K-thNN算法在大多数情况下表现最佳,也确定了两个清晰的簇,一个有“局部”数据集,另一个有“全局”数据集,考虑到算法的计算复杂性,这三种算法足以找到代表性的多元数据集中的异常。
May, 2023
本文提出了一种无监督方法AD-MERCS,旨在利用正常和异常模式来检测异常。该方法识别出多个子空间,以及识别出在这些模式之外的特征,能够对多种异常进行有效的检测,并能够通过在低维子空间中的模式和特征提供异常检测的简单解释。
May, 2023
提出两种基于分类的半监督异常检测方法,一种基于无偏风险估计器的半监督浅层方法和一种利用非负偏向风险估计器的半监督深层方法,通过建立估计误差和风险过度界限来证明两者的有效性,并提出选择合适的正则化参数以确保浅层模型下经验风险非负性的技术。
Sep, 2023
无法线性分类XOR激发了深度学习的很多研究。我们重新审视这个古老的问题并证明线性分类XOR是可能的。我们提出了一种稍微不同的范式,即等式分离,将SVM目标适应于区分数据在或超过边界之外。我们的分类器可以与神经网络流水线集成,并进行平滑逼近。根据其属性,我们直觉等式分离适用于异常检测。为了形式化这个概念,我们引入了封闭数字,这是对分类器形成封闭决策区域的容量的定量度量。基于这个二元分类与异常检测之间的理论联系,我们在监督异常检测实验中测试了我们的假设,结果显示等式分离可以检测到已知和未知的异常。
Dec, 2023
本研究解决了无监督异常检测缺乏理论保障的问题,提出通过将其转化为二分类问题,建立了神经网络的额外风险的非渐近上界和收敛速率。研究发现,优化模型能够达到文献中最优的极小最大速率,同时提供了实现最佳性能所需的合成异常数量的界限。
Sep, 2024