非负矩阵分解中的二到五个真相
非负矩阵因式分解也称为广义 Kullback-Leibler 散度 (NMF) 和隐含狄利克雷分配 (LDA) 是两种用于非负数据降维的流行方法。在这篇论文中,我们展示了在对分解的两个矩阵的列添加 $\ell_1$ 归一化约束和一个狄利克雷先验的条件下,NMF 与 LDA 等效。我们的方法还揭示了一个矩阵上的 Lasso 惩罚和另一个矩阵的 $\ell_1$ 归一化约束是不足以引发任何稀疏性的。
May, 2024
通过结合相关对象,无监督机器学习技术旨在揭示数据集中的潜在模式。在本文中,我们提出了一项关于多模态聚类算法的研究,并提出了一种名为多模态多视图非负矩阵分解的新方法,其中我们分析了多个局部 NMF 模型的协同作用。实验结果表明,所提出的方法具有较大的价值,并使用多种数据集进行评估,相比于现有的方法,获得了非常有前景的结果。
Aug, 2023
本文提出了一种加速处理非负矩阵分解问题的技术,通过在每个迭代步骤中精确分析计算成本,来保持算法的收敛性。这种加速技术可以应用于其他算法,并且已在图像和文本数据集上进行了实证研究。
Jul, 2011
文中介绍了一种使用 Federated NMF 和互信息(MI)的方法,可以在尊重客户数据隐私的同时,帮助多个客户一起训练矩阵分解话题模型,并更好地进行自然语言处理
May, 2022
本文介绍了非负矩阵分解的稀疏特征提取功能,并探讨了如何解决通常情况下 NP 困难的 NMF 问题,介绍了一个称为近可分离 NMF 的问题子类,可以高效地解决一些在有噪声的情况下的 NMF 问题。最后简要描述了 NMF 在数学和计算机科学领域的若干相关问题。
Jan, 2014
通过引入顶 ological NMF 和 robust topological NMF 方法,并利用 12 个数据集进行验证,我们证明了提出的 TNMF 和 rTNMF 明显优于其他基于 NMF 的方法,并在可视化中使用 TNMF 和 rTNMF 进行了 Uniform Manifold Approximation and Projection (UMAP) 和 t-distributed stochastic neighbor embedding (t-SNE)。
Oct, 2023
对称非负矩阵分解是一种在数据分析和机器学习中利用非负、低秩矩阵及其转置来近似表示对称矩阵的技术。为了设计更快速和更可扩展的对称非负矩阵分解算法,我们开发了两种随机化算法来计算。第一种算法利用随机矩阵草图计算初始低秩输入矩阵,并利用此输入迅速计算对称非负矩阵分解。第二种算法利用随机杠杆得分采样来近似解决受限最小二乘问题。实验证明,这两种方法在实践中都非常有效,通过将它们应用于大型真实数据集上的图聚类任务,我们展示了这些方法在保持解决方案质量的同时显著提速,无论是在大规模稠密问题还是大规模稀疏问题上。
Feb, 2024
本文提出了一种新的针对大规模网络嵌入学习的算法 ——NetSMF,可以有效地稀疏该密集矩阵,维持了嵌入学习的表征能力,相比已有方法,NetSMF 在效率和有效性上都具有优势。
Jun, 2019