矩阵分解的数据融合

Jul, 2013

Data Fusion by Matrix Factorization

Marinka Žitnik, Blaž Zupan

TL;DR使用 DFMF 矩阵三因子分解的数据融合算法，将基于特征、本体、关联和网络的十七种不同数据源有效地融合，可以用于基因功能预测和预测药理作用，并取得了比其他数据融合方法更高的准确度。

Abstract

For most problems in science and engineering we can obtain data sets that describe the observed system from various perspectives and record the behavior of its individual components. Heterogeneous data sets can be collectively mined by data fusion. Fusion can focus on a specific target

data fusion penalized matrix tri-factorization gene function prediction pharmacologic actions data integration

发现论文，激发创造

数据整合的贝叶斯混合矩阵分解

引入了一种新的贝叶斯混合矩阵分解模型（HMF）用于数据集成，能够结合多种矩阵分解方法，可用于预测缺失值的内部和外部矩阵，同时可集成许多不同实体类型的数据集，包括重复实验、相似度矩阵和非常稀疏的数据集。我们将方法应用于两个生物应用，并与最先进的机器学习和矩阵分解模型进行广泛比较。对于药物敏感性数据集的内部矩阵预测，我们获得了比现有方法更优异的性能，特别是当我们增加数据集的稀疏性时。此外，我们还对甲基化和基因表达数据集进行了外部矩阵预测，在其中三个数据集中有两个获得了最佳结果，特别是当数据集的可预测性高时。

Apr, 2017

神经网络矩阵分解

本文介绍一种基于神经网络与矩阵分解的方法，使用最优化技术得到潜在特征向量并据此构建神经网络，进而代替传统内积的矩阵分解方法，从而在一些测试数据集上达到更好的效果。

Nov, 2015

耦合矩阵和张量分解的一次性优化

本文提出了一种耦合矩阵和张量分解 (CMTF) 方法，通过 all-at-once 优化的方法来融合包含不同矩阵和高阶张量的异构数据集，并可以处理不完整数据集，实现更精准的数据分析。

May, 2011

基于非负矩阵分解的多模态多视角聚类

通过结合相关对象，无监督机器学习技术旨在揭示数据集中的潜在模式。在本文中，我们提出了一项关于多模态聚类算法的研究，并提出了一种名为多模态多视图非负矩阵分解的新方法，其中我们分析了多个局部 NMF 模型的协同作用。实验结果表明，所提出的方法具有较大的价值，并使用多种数据集进行评估，相比于现有的方法，获得了非常有前景的结果。

Aug, 2023

基于特征的矩阵分解

本技术报告介绍了特征基矩阵分解的实现，该模型是矩阵分解模型的许多变体的抽象，可以通过定义新特征而利用新类型的信息，而无需修改任何代码。使用该工具包，我们构建了 KDDCup'11 赛道 1 报告的最佳单个模型。

Sep, 2011

安全联合矩阵分解

本研究提出一种基于矩阵分解的安全联邦学习框架，称为 FedMF，利用同态加密技术实现了对上传信息的加密保护，从而解决联邦学习中梯度泄露的问题，并证明了其可行性。

Jun, 2019

FedDMF：使用深度矩阵分解实现隐私保护的用户属性预测

提出一种新的算法，通过训练不同客户端的深度矩阵因式分解模型并仅共享物品向量来预测用户属性，从而解决用户属性预测中的一些重要隐私问题。

Dec, 2023

结构化矩阵分解在单位超立方体中的矩阵补全

本文提出了两个矩阵分解模型，用于预测电影特效渲染艺术家的效率，并对其进行了广泛的数值测试。这些模型基于矩阵完成问题，利用了作者对 VFX 环境的了解。其中，一个模型为可解释的专业知识矩阵分解（EMF），另一个为概率性生存矩阵分解（SMF）。

May, 2019

分布式二进制矩阵分解使用近端优化

通过联邦学习的角度，我们提出了一种基于连续二元矩阵分解松弛的布尔矩阵分解算法，仅共享松弛的组件矩阵，并使用一种近端运算符聚合它们，从而在保证二元结果的同时，实现了高效的基于梯度的优化。通过实验证明，我们的算法在质量和效果方面优于其他最先进的布尔矩阵分解方法的联邦学习方案。

Jul, 2024

DF-DM：人工智能时代的多模态数据融合的基础过程模型

在大数据时代，将多样化的数据模态融合在一起对于像医疗保健等复杂领域来说是一项巨大的挑战。本文介绍了一种新的多模态数据融合数据挖掘过程模型，将嵌入和跨行业标准数据挖掘流程与现有的数据融合信息团组合模型相结合。我们的模型旨在降低计算成本、复杂性和偏差，同时提高效率和可靠性。我们还提出了一种名为 “分离的密集融合” 的新型嵌入融合方法，旨在优化互信息和促进稠密的跨模态特征交互，从而最小化冗余信息。我们通过三个案例展示了该模型的有效性：使用视网膜图像和患者元数据预测糖尿病性视网膜病变、使用卫星图像、互联网和人口普查数据预测家庭暴力，以及从放射影像和临床笔记中识别临床和人口统计特征。该模型在糖尿病性视网膜病变预测中的宏 F1 分数为 0.92，在家庭暴力预测中的 R 方为 0.854，sMAPE 为 24.868，在放射学分析中的宏 AUC 分别为 0.92 和 0.99，这些结果凸显了数据挖掘模型在多模态数据处理中的潜力，推动其在不同的资源受限环境中的应用。

Apr, 2024