基于列生成的二元矩阵分解

AAAINov, 2020

Binary Matrix Factorisation via Column Generation

Reka A. Kovacs, Oktay Gunluk, Raphael A. Hauser

TL;DR本文通过线性规划和列生成的优化技术，提出了一种求解低秩二元矩阵分解问题的算法，该算法不需要使用启发式模式挖掘，具有高精度和优化保证，并在真实数据集上取得了良好的效果。

Abstract

Identifying discrete patterns in binary data is an important dimensionality reduction tool in machine learning and data mining. In this pa

binary data machine learning data mining low-rank binary matrix factorisation optimisation

发现论文，激发创造

布尔矩阵分解的最新发展

本文概述了 Boolean Matrix Factorization（BMF）在数据挖掘、正式概念分析、机器学习和理论等领域的研究进展，提出了需要进一步探讨的问题。

Dec, 2020

基于几何分割的快速高效布尔矩阵分解

本研究开发了一种名为 MEBF 的快速、高效的布尔矩阵因式分解方法，采用启发式方法以定位 “密集的 1” 的子矩阵为目标，其性能表现优于 ASSO、PANDA 和 MP 等其他常用方法，同时在二进制和非二进制数据集上的应用表明其具有知识检索和数据去噪的潜在能力。

Sep, 2019

使用整数规划的布尔矩阵分解算法

本文提出了一种基于整数规划的交替优化策略，来解决二进制矩阵因数分解的问题，同时给出了两种初始化因子的方式，并展示了如何使用整数规划将多个解组合起来以生成更优的解。实验结果表明，我们的算法优于现有方法。

May, 2023

从理论到实践：布尔和有限域矩阵分解

基于针对实践的 heuristics 我们提出了一种新的算法，它基于 BMF 的最新的理论进展，用于在有限域上找到 GF （p）-Matrix 分解的有效多项式时间逼近方案，并通过人工合成和现实世界数据的实证研究证明了我们算法的优越性。

Jul, 2022

贝叶斯布尔矩阵分解

介绍了一种概率生成模型 ——OrMachine，用于布尔矩阵分解和推导出马尔科夫链蒙特卡罗 (Metropolised Gibbs) 采样器，实现了高效的并行后验推断，并在真实世界和模拟数据上优于目前所有现有的布尔矩阵分解和完整方法，首次为布尔矩阵分解提供了完整的后验推断，在协同过滤中用于控制假阳性率，并关键地提高了推断模式的可解释性。提出的算法在通用硬件上扩展到大型数据集，如在 1.3 百万只老鼠脑细胞上分析 11 千个基因的单细胞基因表达。

Feb, 2017

使用近端梯度下降有效因式分解布尔矩阵

本研究提出了一种使用弹性二进制正则化的布尔矩阵分解算法，以降低计算成本并提高可解释性，在合成和真实数据上实现了良好的结果。在医学领域的案例研究表明了该算法的结果易于解释和语义意义重大。

Jul, 2023

贝叶斯均值参数化非负二进制矩阵分解

本文提出了一种针对二元数据矩阵的基于贝叶斯平均参数非负矩阵分解的方法，并使用折叠吉布斯采样和折叠变分算法推断了因子的后验分布，同时将所提出方法拓展到非参数设置下，实现自动检测相关成分数量，实验证明该方法在词典学习和预测任务方面的性能优于现有技术。

Dec, 2018

基于消息传递的布尔矩阵分解和噪声补全

通过图模型和传递信息的方法，本文提出一种处理布尔矩阵分解和噪声下的布尔矩阵完成的方法，可线性处理观察点和因子数量，实验结果表明该方法在实际应用中可以较好地恢复低秩布尔矩阵。

Sep, 2015

二进制分解矩阵

研究低秩矩阵分解问题，其中一个因子具有 {0,1} 约束条件，第二个因子可以加入凸约束条件；提出一种基于近期非负矩阵分解算法的解决方案，可通过组合数学中的 Littlewood-Offord 引理，在 O (m r 2^r + mnr + r^2 n) 次操作下准确计算低秩分解。

Jan, 2014

数据流中的双聚类和布尔矩阵分解

本文在数据流中对二分图聚类和布尔矩阵分解问题进行了研究，提出一种使用亚线性空间复杂度，在数据流遍历一遍后能够恢复右部聚类的算法，并且在第二次遍历中能够恢复左部聚类，同时还能够扩展该算法来解决布尔矩阵分解问题。

Dec, 2020