布尔矩阵分解中的自下而上近似:几何与新算法
本文概述了 Boolean Matrix Factorization(BMF)在数据挖掘、正式概念分析、机器学习和理论等领域的研究进展,提出了需要进一步探讨的问题。
Dec, 2020
基于针对实践的 heuristics 我们提出了一种新的算法,它基于 BMF 的最新的理论进展,用于在有限域上找到 GF (p)-Matrix 分解的有效多项式时间逼近方案,并通过人工合成和现实世界数据的实证研究证明了我们算法的优越性。
Jul, 2022
介绍了一种概率生成模型 ——OrMachine,用于布尔矩阵分解和推导出马尔科夫链蒙特卡罗 (Metropolised Gibbs) 采样器,实现了高效的并行后验推断,并在真实世界和模拟数据上优于目前所有现有的布尔矩阵分解和完整方法,首次为布尔矩阵分解提供了完整的后验推断,在协同过滤中用于控制假阳性率,并关键地提高了推断模式的可解释性。提出的算法在通用硬件上扩展到大型数据集,如在 1.3 百万只老鼠脑细胞上分析 11 千个基因的单细胞基因表达。
Feb, 2017
本文研究文献中关于维数约减最常讨论的算法之一,即用低秩矩阵来近似输入矩阵的算法。我们介绍了 Martinsson 等人(2008)中算法的新颖分析方法,可以得出尖锐的估计和关于其性能的新见解。通过实验,我们证明了我们预测的紧密性与经验观测的一致性。
Aug, 2013
本研究开发了一种名为 MEBF 的快速、高效的布尔矩阵因式分解方法,采用启发式方法以定位 “密集的 1” 的子矩阵为目标,其性能表现优于 ASSO、PANDA 和 MP 等其他常用方法,同时在二进制和非二进制数据集上的应用表明其具有知识检索和数据去噪的潜在能力。
Sep, 2019
通过图模型和传递信息的方法,本文提出一种处理布尔矩阵分解和噪声下的布尔矩阵完成的方法,可线性处理观察点和因子数量,实验结果表明该方法在实际应用中可以较好地恢复低秩布尔矩阵。
Sep, 2015
本研究提出了一种使用弹性二进制正则化的布尔矩阵分解算法,以降低计算成本并提高可解释性,在合成和真实数据上实现了良好的结果。在医学领域的案例研究表明了该算法的结果易于解释和语义意义重大。
Jul, 2023
本研究提出了一种基于分布式学习的去中心化方法来分解稀疏矩阵为低密度矩阵,避免了中央服务器的需求,并在多个合成和真实数据集上验证了算法的性能。
Nov, 2017
本文通过线性规划和列生成的优化技术,提出了一种求解低秩二元矩阵分解问题的算法,该算法不需要使用启发式模式挖掘,具有高精度和优化保证,并在真实数据集上取得了良好的效果。
Nov, 2020
本文在数据流中对二分图聚类和布尔矩阵分解问题进行了研究,提出一种使用亚线性空间复杂度,在数据流遍历一遍后能够恢复右部聚类的算法,并且在第二次遍历中能够恢复左部聚类,同时还能够扩展该算法来解决布尔矩阵分解问题。
Dec, 2020