鲁棒贝叶斯张量分解与零膨胀泊松模型及一致性聚合
本文提出了 MahNMF 方法以及5种扩展,用于处理非负矩阵。利用两种算法,即秩一残留迭代(RRI)方法和Nesterov的平滑方法,有效地优化了MahNMF和其扩展。MahNMF方法在处理重尾部的拉普拉斯噪声时,能够很好地拟合数据,是一种鲁棒性较强的方法。
Jul, 2012
提出一种新的张量分解方法: 稀疏分层- 特克 (Sparse H-Tucker),用于解决稀疏和高阶数据张量的问题。该方法的嵌套采样技术解决了传统的层次特克方法中所存在的可扩展性问题,此方法更快,更节省空间,并且能够构建一个可解释的疾病层次结构,并且已在真实的医疗保健数据集上进行了广泛的测试。
Oct, 2016
该论文探讨了在低精度下使用机器学习模型进行训练的可行性,提出了一种名为ZipML的框架,通过双重采样策略实现线性模型的低精度训练,避免了由于量化导致的引入偏差问题,并在各种应用场景中进行了验证。同时,通过使用方差优化的随机量化策略,在包括非线性模型在内的多种情况下,得出了有关低精度机器学习的重要结论和实用价值。
Nov, 2016
介绍了一种概率生成模型——OrMachine,用于布尔矩阵分解和推导出马尔科夫链蒙特卡罗(Metropolised Gibbs)采样器,实现了高效的并行后验推断,并在真实世界和模拟数据上优于目前所有现有的布尔矩阵分解和完整方法,首次为布尔矩阵分解提供了完整的后验推断,在协同过滤中用于控制假阳性率,并关键地提高了推断模式的可解释性。提出的算法在通用硬件上扩展到大型数据集,如在1.3百万只老鼠脑细胞上分析11千个基因的单细胞基因表达。
Feb, 2017
本文提出了一种针对二元数据矩阵的基于贝叶斯平均参数非负矩阵分解的方法,并使用折叠吉布斯采样和折叠变分算法推断了因子的后验分布,同时将所提出方法拓展到非参数设置下,实现自动检测相关成分数量,实验证明该方法在词典学习和预测任务方面的性能优于现有技术。
Dec, 2018
通过引入顶ological NMF和robust topological NMF方法,并利用12个数据集进行验证,我们证明了提出的TNMF和rTNMF明显优于其他基于NMF的方法,并在可视化中使用TNMF和rTNMF进行了Uniform Manifold Approximation and Projection (UMAP)和t-distributed stochastic neighbor embedding (t-SNE)。
Oct, 2023
利用监督矩阵分解(SMF)方法,在高维数据中学习低秩潜在因素,并提供可解释性、数据重构性和类别区分性特征,通过一个新颖框架将SMF提升为一个结合因子空间的低秩矩阵估计问题,并提出了一个有效算法,在各种癌症中成功识别了已知的与癌症相关的基因组。
Nov, 2023
本研究针对多矩阵数据的关联性问题,提出了一种经验变分贝叶斯方法,以灵活整合多个矩阵中的共享信号。该方法在通用条件下保证了分解的唯一性,并通过新颖的迭代插补方法有效处理缺失数据。实验结果显示,该方法在恢复低秩信号、分解共享和特定信号,以及插补缺失数据方面表现优越,特别在乳腺癌基因表达和miRNA数据分析中显著优于其他策略。
Aug, 2024