介绍了一种概率生成模型 ——OrMachine,用于布尔矩阵分解和推导出马尔科夫链蒙特卡罗 (Metropolised Gibbs) 采样器,实现了高效的并行后验推断,并在真实世界和模拟数据上优于目前所有现有的布尔矩阵分解和完整方法,首次为布尔矩阵分解提供了完整的后验推断,在协同过滤中用于控制假阳性率,并关键地提高了推断模式的可解释性。提出的算法在通用硬件上扩展到大型数据集,如在 1.3 百万只老鼠脑细胞上分析 11 千个基因的单细胞基因表达。
Feb, 2017
本文针对具有噪声的矩阵完成任务进行了研究,特别关注于估计由两个未知矩阵的乘积组成的矩阵,其中一个是稀疏矩阵的情况,提出了基于稀疏因子模型的正则化最大似然估计的误差界和算法方法。
Nov, 2014
使用统计力学工具分析了矩阵分解问题的可实现性和计算可处理性,在贝叶斯最优推断设置下计算任意计算时间内可能实现的最小均方误差和有效近似迭代推理算法可以达到的误差。
Feb, 2014
基于高斯过程潜变量模型的贝叶斯非线性矩阵补全算法,经过数据并行分布式计算方法加以优化,实现了对于高度稀疏大型矩阵的预测任务,得到了较好的实验结果。
Jul, 2019
本文概述了 Boolean Matrix Factorization(BMF)在数据挖掘、正式概念分析、机器学习和理论等领域的研究进展,提出了需要进一步探讨的问题。
Dec, 2020
本文在数据流中对二分图聚类和布尔矩阵分解问题进行了研究,提出一种使用亚线性空间复杂度,在数据流遍历一遍后能够恢复右部聚类的算法,并且在第二次遍历中能够恢复左部聚类,同时还能够扩展该算法来解决布尔矩阵分解问题。
在 Ma 和 Chen 引入的模型的基础上,本文提出了一种两阶段的算法来处理矩阵填充中的观测偏差,并利用共享信息来提高预测性能,经实验证明本算法的表现可与未观测协变量相同,并获得性能提高。
Jun, 2023
本研究提出了一种使用弹性二进制正则化的布尔矩阵分解算法,以降低计算成本并提高可解释性,在合成和真实数据上实现了良好的结果。在医学领域的案例研究表明了该算法的结果易于解释和语义意义重大。
Jul, 2023
本文围绕低秩矩阵重构问题,重点研究在观测样本受噪声污染时的矩阵填充问题,比较了 OptSpace、ADMIRA 和 FPCA 三种最新的填充算法在单一模拟平台上的性能,并给出了数值结果。实验表明,这些优秀的算法可以用于准确重构实际数据矩阵和随机生成的矩阵。
Oct, 2009
该论文提出使用矩阵分解来从噪声协变量中推断混淆因素,减少测量噪声引起的偏差,展示了这个方法在合成数据和临床数据上的实验结果。
Jun, 2018