矩阵分解的数据融合
引入了一种新的贝叶斯混合矩阵分解模型(HMF)用于数据集成,能够结合多种矩阵分解方法,可用于预测缺失值的内部和外部矩阵,同时可集成许多不同实体类型的数据集,包括重复实验、相似度矩阵和非常稀疏的数据集。我们将方法应用于两个生物应用,并与最先进的机器学习和矩阵分解模型进行广泛比较。对于药物敏感性数据集的内部矩阵预测,我们获得了比现有方法更优异的性能,特别是当我们增加数据集的稀疏性时。此外,我们还对甲基化和基因表达数据集进行了外部矩阵预测,在其中三个数据集中有两个获得了最佳结果,特别是当数据集的可预测性高时。
Apr, 2017
本文提出了一种耦合矩阵和张量分解 (CMTF) 方法,通过 all-at-once 优化的方法来融合包含不同矩阵和高阶张量的异构数据集,并可以处理不完整数据集,实现更精准的数据分析。
May, 2011
通过结合相关对象,无监督机器学习技术旨在揭示数据集中的潜在模式。在本文中,我们提出了一项关于多模态聚类算法的研究,并提出了一种名为多模态多视图非负矩阵分解的新方法,其中我们分析了多个局部 NMF 模型的协同作用。实验结果表明,所提出的方法具有较大的价值,并使用多种数据集进行评估,相比于现有的方法,获得了非常有前景的结果。
Aug, 2023
本技术报告介绍了特征基矩阵分解的实现,该模型是矩阵分解模型的许多变体的抽象,可以通过定义新特征而利用新类型的信息,而无需修改任何代码。使用该工具包,我们构建了 KDDCup'11 赛道 1 报告的最佳单个模型。
Sep, 2011
提出一种新的算法,通过训练不同客户端的深度矩阵因式分解模型并仅共享物品向量来预测用户属性,从而解决用户属性预测中的一些重要隐私问题。
Dec, 2023
本文提出了两个矩阵分解模型,用于预测电影特效渲染艺术家的效率,并对其进行了广泛的数值测试。这些模型基于矩阵完成问题,利用了作者对 VFX 环境的了解。其中,一个模型为可解释的专业知识矩阵分解(EMF),另一个为概率性生存矩阵分解(SMF)。
May, 2019
通过联邦学习的角度,我们提出了一种基于连续二元矩阵分解松弛的布尔矩阵分解算法,仅共享松弛的组件矩阵,并使用一种近端运算符聚合它们,从而在保证二元结果的同时,实现了高效的基于梯度的优化。通过实验证明,我们的算法在质量和效果方面优于其他最先进的布尔矩阵分解方法的联邦学习方案。
Jul, 2024
在大数据时代,将多样化的数据模态融合在一起对于像医疗保健等复杂领域来说是一项巨大的挑战。本文介绍了一种新的多模态数据融合数据挖掘过程模型,将嵌入和跨行业标准数据挖掘流程与现有的数据融合信息团组合模型相结合。我们的模型旨在降低计算成本、复杂性和偏差,同时提高效率和可靠性。我们还提出了一种名为 “分离的密集融合” 的新型嵌入融合方法,旨在优化互信息和促进稠密的跨模态特征交互,从而最小化冗余信息。我们通过三个案例展示了该模型的有效性:使用视网膜图像和患者元数据预测糖尿病性视网膜病变、使用卫星图像、互联网和人口普查数据预测家庭暴力,以及从放射影像和临床笔记中识别临床和人口统计特征。该模型在糖尿病性视网膜病变预测中的宏 F1 分数为 0.92,在家庭暴力预测中的 R 方为 0.854,sMAPE 为 24.868,在放射学分析中的宏 AUC 分别为 0.92 和 0.99,这些结果凸显了数据挖掘模型在多模态数据处理中的潜力,推动其在不同的资源受限环境中的应用。
Apr, 2024