数据融合和迁移学习的协方差广义匹配成分分析
介绍了一种名为匹配组件分析的新型 Procrustes 方法,可通过转移学习来分离数据中的组件;理论结果表明其采样复杂度,我们通过数值实验证明了我们的方法确实非常适合于转移学习。
Sep, 2019
本文介绍了三种新的概率规范相关分析的半参数扩展,并考虑了这些模型估计的矩匹配技术。通过将新模型与独立分量分析的离散版本(DICA)之间的显式联系画出,并进一步使用与独立分量分析的密切联系介绍广义协方差矩阵,以改善样本复杂度并显著简化推导和算法。
Feb, 2016
提出了 Deep Generalized Canonical Correlation Analysis (DGCCA) 方法,通过学习非线性变换最大化信息关联,结合非线性(深度)表示学习的灵活性与多个独立来源视图的信息统计力量,通过在两个不同数据集上的三个下游任务训练,成功击败了已有的标准线性多视图技术,在语音转录和 Twitter 用户的 hashtag 推荐等方面表现更好。
Feb, 2017
探索多个观测随机向量之间的潜在共变性的经典统计方法 —— 典型相关分析 (CCA) 以及其扩展和变化在发现多视图数据集中的共同随机因素方面的能力。该研究设计了一种新颖高效的模型,适用于典型相关分析的深度扩展,并克服了现有方法的局限性,将私有组件建模为在给定共同组件的条件下条件独立,从而提供了一种更紧凑的表述形式。通过合成数据和实际数据的实验验证了我们的结论和方法的有效性。
Dec, 2023
我们引入了一种新颖的基于图对比的图匹配框架(GCGM),利用大量的图扩充进行对比学习,无需任何额外的辅助信息,通过各种实验证实,我们的 GCGM 在各个数据集上超过了最先进的自监督方法,迈向了更有效、高效和通用的图匹配。
Jun, 2024
本文提出了一种名为 ACA 的算法,利用对数据的增强进行自我监督学习。该算法通过对数据的增强进行特征提取得到数据的增强分布,然后采用对比损失将其映射到低维空间中,实现有效的数据降维,从而提高了数据的相似性计算效率。
Jun, 2022
该研究提出了多组学数据集成的一种新方法,称为 SDGCCA。SDGCCA 能够建模非线性多种组学流形之间的相关结构,旨在改善表型分类并揭示与表型相关的生物标志物。应用于老年痴呆症患者的预测和早期和晚期癌症的区分中,SDGCCA 表现出优异的性能,还能用于特征选取以识别重要的多组学生物标记物。在老年痴呆症数据中,SDGCCA 识别了与老年痴呆症相关的基因簇。
Apr, 2022
我们提出了一种两步传递学习算法,通过从多个主成分分析(PCA)研究中提取有用信息来增强目标 PCA 任务的估计精度,并对理论进行了分析,证明了在知识传递之后经验谱投影矩阵的双线性形式在较弱的特征值间隔条件下渐进地正态分布。
Mar, 2024
通过特征基匹配合成图 (GCEM) 方法,我们解决了现有方法在图神经网络 (GNN) 的合成图上存在的泛化能力差的问题,通过匹配真实图和合成图的特征基,消除了 GNN 的谱偏差,并保留了图的结构信息,大大缩小了不同 GNN 之间的性能差距。
Oct, 2023
研究了标准相关分析的随机优化,提出了两种全局收敛的元算法,通过将原问题转化为序列的最小二乘问题,使用最先进的 SGD 方法,并获得了显著的时间复杂度改进。
Apr, 2016