TensOrMachine: 概率布尔张量分解
介绍了一种概率生成模型 ——OrMachine,用于布尔矩阵分解和推导出马尔科夫链蒙特卡罗 (Metropolised Gibbs) 采样器,实现了高效的并行后验推断,并在真实世界和模拟数据上优于目前所有现有的布尔矩阵分解和完整方法,首次为布尔矩阵分解提供了完整的后验推断,在协同过滤中用于控制假阳性率,并关键地提高了推断模式的可解释性。提出的算法在通用硬件上扩展到大型数据集,如在 1.3 百万只老鼠脑细胞上分析 11 千个基因的单细胞基因表达。
Feb, 2017
本篇论文提出了一种名为 InfTucker 的新的张量分解模型,采用基于贝叶斯模型的 tensor-variate latent nonparametric Bayesian 模型,并结合高效推理方法,适用于多元数据分析,可处理多种数据类型和不确定性,实验结果显示其预测准确性优于现有的最先进的 tensor 分解模型。
Aug, 2011
本研究主要介绍了张量网络、张量分解、多元分析,低秩逼近以及大数据分析等多个方面,并讨论了其在异常检测、特征提取、分类、聚类分析、数据融合和集成、模式识别、预测建模、回归、时间序列分析和多元分析等领域中的潜在应用。
Mar, 2014
在这篇文章中,我们提出了一种高效的变分贝叶斯概率 BTD 方法,利用 von-Mises Fisher 矩阵分布对多线性 Tucker 部分在 BTD 中施加正交性,通过合成和两个真实数据集的实验,我们突出了贝叶斯推断过程,并演示了在噪声数据和模型顺序量化中使用所提出的 pBTD 的能力,我们发现概率 BTD 能够量化适用的多线性结构,为多线性数据中模式的鲁棒推断提供了一种方法。
Oct, 2023
我们提出了一种多字典张量分解(MDTD)框架,利用编码字典中关于张量模式的先验结构信息来获得稀疏编码的张量因子。通过实验证明,MDTD 相比无字典方法学习到更简洁的模型,且在重构质量、缺失值插补质量和张量秩的估计等方面均具有明显的改进,而且不会增加运行时间。
Sep, 2023
本文研究了一种高效的参数估计方法,可用于广泛的潜变量模型,特别是那些具有张量结构的模型,包括高斯混合模型、隐马尔可夫模型和潜在狄利克雷分配模型,通过对表示模型可观测矩阵的低阶矩(通常为二阶和三阶)的张量进行分解获得。方法为鲁棒性较强、可有效计算,并可应用于多个流行的潜变量模型。
Oct, 2012
本文研究了 CANDECOMP/PARAFAC(CP)张量分解在多维数据降维中的应用,提出了一种基于随机算法的简单但强大的算法来计算大规模张量的近似 CP 分解,并通过多个实验结果证明了该算法的性能。
Mar, 2017