边缘拉普拉斯评分

Nov, 2023

Marginal Laplacian Score

Guy Hay, Ohad Volk

TL;DR高维度不平衡数据中，无监督特征选择方法对于后续算法的成功至关重要。为此，我们提出了一种更适用于不平衡数据的边缘拉普拉斯得分（Marginal Laplacian Score，MLS）算法，并将其集成到现代特征选择方法中，形成 DUFS-MLS。该方法在合成数据和公共数据集上展示了鲁棒性和改进性能。

Abstract

high-dimensional imbalanced data poses a machine learning challenge. In the absence of sufficient or high-quality labels, unsupervised feature selection methods are crucial for the success of subsequent algorithm

high-dimensional imbalanced data unsupervised feature selection marginal laplacian score imbalance data differentiable unsupervised feature selection

发现论文，激发创造

高斯混合模型的两轮变种 EM 算法

本文探讨了 Bayesian 网络中无监督与有监督模型选择领域的差异，观察到标准边际似然得分标准并不能很好地适用于有监督模型选择，对比实证分析发现 Dawid 的预测序列原则的方法可以在该领域中获得最佳结果。

Jan, 2013

无监督特征分析及类间间隔优化

该论文提出了一种基于无监督学习的特征选择方法，将最大间隔准则和基于稀疏性的模型整合到一个联合框架中，将类间间距和特征相关性同时考虑，通过将 Kmeans 嵌入框架中来生成伪类标签，从提取特征系数矩阵的稀疏结构来有效去除噪声和无关特征，并提出了一种收敛保证的算法以迭代地寻找最优解，对六个基准数据集进行了广泛的性能评估，实验结果表明，该方法的性能优于所有其他对比方法。

Jun, 2015

用于稀疏标记数据分类的持久性拉普拉斯增强算法

本文提出一种称为 PL-MBO 的代数拓扑半监督学习方法，它将持久谱图理论与经典的 MBO 方法相结合，通过一系列链复杂体和关联的简单复杂体构建一族持久拉普拉斯变换，从而实现在标记数据量较少的情况下实现良好的性能。

May, 2023

多视角稀疏拉普拉斯特征图在非线性光谱特征选择中的应用

多视图稀疏拉普拉斯特征映射是一个基于图的方法，通过多次观察数据以构建更强健和信息丰富的高维数据表示，通过稀疏特征分解和优化算法来降低数据维度并获得一个特征集。作者在 UCI-HAR 数据集上进行实验证明即使将特征空间减少 90%，支持向量机（SVM）的错误率仅为 2.72%，且在整体特征空间减少 80% 的情况下 SVM 精度为 96.69%。

Jul, 2023

使用具有标签分布感知边缘损失函数学习不平衡数据集

为了解决深度学习在类别分布不平衡的情况下训练表现差的问题，本研究提出了两种新的方法：一、设计了基于理论的标签分布感知边界 (LDAM) 损失函数；二、提出了一种简单而有效的训练策略来推迟重新加权，并在减轻权重的复杂性的同时实现模型对初始表示的学习，实验结果表明这两种方法能够提高模型性能。

Jun, 2019

最大边缘损失学习不平衡数据集

本文设计了一种新的最大边距 (MM) 损失函数来解决类不平衡数据中存在的分类不平衡问题，并探讨了两种基于最大边界的决策边界位移方法在 LDAM 训练日程上的表现。

Jun, 2022

高维回归的稀疏拉普拉斯缩减估计器

本文提出了一种基于 Laplacian quadratic 的罚函数的稀疏 Laplacian 收缩（SLS）方法，该方法能在鼓励稀疏性和促进相关预测变量之间平滑性的前提下，具有图表示的广义分组特性，并通过坐标下降算法进行计算。该方法表现优异且拥有选定一致性，适用于高维数据下的变量选择和估计。

Dec, 2011

半监督学习的适当加权图拉普拉斯算子

本文介绍了一种针对大数据量下半监督学习中图拉普拉斯方法性能下降问题的解决方案，通过正确设置拉普拉斯正则化的权重使得估计器在大样本情况下保持良好状态，并证明了其收敛性，最终实现连续达到标记值的问题平滑解，且方法实现快捷简便。

Oct, 2018

原始形式下的拉普拉斯支持向量机训练

本文提出两种解决原始 LapSVM 问题的策略，以改善在使用无标签数据进行分类时所遇到的问题，并在真实数据实验中验证了该方法的有效性。

Sep, 2009

低密度分离假设下监督学习和无监督学习之间的随机矩阵分析

我们提出了一个理论框架，用于分析高维情况下基于低密度分离假设的半监督分类。我们介绍了 QLDS，一个线性分类模型，其中低密度分离假设通过二次边界最大化来实现。该算法具有显式解和丰富的理论性质，我们证明了我们算法的特殊情况是有监督情况下的最小二乘支持向量机，完全非监督情况下的谱聚类以及一类半监督图方法。因此，QLDS 在这些有监督和无监督学习方法之间建立了一个平滑的桥梁。利用随机矩阵理论的最新进展，我们正式推导了在渐近情况下的分类误差的理论评估。作为应用，我们得出一个超参数选择策略，找到在我们学习准则的有监督项和无监督项之间的最佳平衡。最后，我们提供了我们框架的广泛示例，以及在几个基准测试上的实验研究，证明了 QLDS 在计算效率更高的同时，在超参数选择上优于交叉验证，表明随机矩阵理论在半监督模型选择中具有很大的潜力。

Oct, 2023