非负矩阵分解中的二到五个真相

May, 2023

Two to Five Truths in Non-Negative Matrix Factorization

John M. Conroy, Neil P Molino, Brian Baughman, Rod Gomez, Ryan Kaliszewski...

TL;DR本文探讨了矩阵缩放对非负矩阵分解进行主题建模的作用。作者提出了一种基于归一化拉普拉斯 (NL) 的缩放方法，其在文本话题建模方面的效果显著，并且在三个数据集上证明了它的优越性。作者认为这种缩放方法与其他矩阵缩放方法存在关联。

Abstract

In this paper, we explore the role of matrix scaling on a matrix of counts when building a topic model using non-negative matrix factorization. We present a scaling inspired by the →

matrix scaling non-negative matrix factorization topic modeling spectral clustering normalized laplacian

发现论文，激发创造

非负矩阵分解与潜在狄利克雷分配之间的联系

非负矩阵因式分解也称为广义 Kullback-Leibler 散度 (NMF) 和隐含狄利克雷分配 (LDA) 是两种用于非负数据降维的流行方法。在这篇论文中，我们展示了在对分解的两个矩阵的列添加 $\ell_1$ 归一化约束和一个狄利克雷先验的条件下，NMF 与 LDA 等效。我们的方法还揭示了一个矩阵上的 Lasso 惩罚和另一个矩阵的 $\ell_1$ 归一化约束是不足以引发任何稀疏性的。

May, 2024

对称矩阵分解的再思考：更一般且更优的聚类视角

本文提出了使用正则项优化的高效因式分解算法来提高聚类性能，同时进一步探索了使用不同约束条件解决对称矩阵分解问题的通用框架。

Sep, 2022

基于非负矩阵分解的多模态多视角聚类

通过结合相关对象，无监督机器学习技术旨在揭示数据集中的潜在模式。在本文中，我们提出了一项关于多模态聚类算法的研究，并提出了一种名为多模态多视图非负矩阵分解的新方法，其中我们分析了多个局部 NMF 模型的协同作用。实验结果表明，所提出的方法具有较大的价值，并使用多种数据集进行评估，相比于现有的方法，获得了非常有前景的结果。

Aug, 2023

非负矩阵分解的加速乘法更新和分层 ALS 算法

本文提出了一种加速处理非负矩阵分解问题的技术，通过在每个迭代步骤中精确分析计算成本，来保持算法的收敛性。这种加速技术可以应用于其他算法，并且已在图像和文本数据集上进行了实证研究。

Jul, 2011

基于互信息的短文本主题建模的联邦非负矩阵分解

文中介绍了一种使用 Federated NMF 和互信息（MI）的方法，可以在尊重客户数据隐私的同时，帮助多个客户一起训练矩阵分解话题模型，并更好地进行自然语言处理

May, 2022

非负矩阵分解的原因和方法

本文介绍了非负矩阵分解的稀疏特征提取功能，并探讨了如何解决通常情况下 NP 困难的 NMF 问题，介绍了一个称为近可分离 NMF 的问题子类，可以高效地解决一些在有噪声的情况下的 NMF 问题。最后简要描述了 NMF 在数学和计算机科学领域的若干相关问题。

Jan, 2014

应用拓扑非负矩阵分解分析单细胞 RNA 测序

通过引入顶 ological NMF 和 robust topological NMF 方法，并利用 12 个数据集进行验证，我们证明了提出的 TNMF 和 rTNMF 明显优于其他基于 NMF 的方法，并在可视化中使用 TNMF 和 rTNMF 进行了 Uniform Manifold Approximation and Projection (UMAP) 和 t-distributed stochastic neighbor embedding (t-SNE)。

Oct, 2023

连续半监督非负矩阵分解

本文介绍了如何使用非负矩阵分解方法无监督地自动检测语料库中的主题，并证明该方法可结合回归得出比先识别主题后进行回归更好的效果并有更好的可解释性。

Dec, 2022

对称非负矩阵分解的随机算法

对称非负矩阵分解是一种在数据分析和机器学习中利用非负、低秩矩阵及其转置来近似表示对称矩阵的技术。为了设计更快速和更可扩展的对称非负矩阵分解算法，我们开发了两种随机化算法来计算。第一种算法利用随机矩阵草图计算初始低秩输入矩阵，并利用此输入迅速计算对称非负矩阵分解。第二种算法利用随机杠杆得分采样来近似解决受限最小二乘问题。实验证明，这两种方法在实践中都非常有效，通过将它们应用于大型真实数据集上的图聚类任务，我们展示了这些方法在保持解决方案质量的同时显著提速，无论是在大规模稠密问题还是大规模稀疏问题上。

Feb, 2024

NetSMF: 大规模网络嵌入作为稀疏矩阵分解

本文提出了一种新的针对大规模网络嵌入学习的算法 ——NetSMF，可以有效地稀疏该密集矩阵，维持了嵌入学习的表征能力，相比已有方法，NetSMF 在效率和有效性上都具有优势。

Jun, 2019