富组分分析

Jul, 2015

Rich Component Analysis

Rong Ge, James Zou

TL;DR本文介绍了一个名为RCA的模型框架，它可以用于分析多个数据集中的不同潜在组件，通过累积量提取算法，该模型可以明确地学习每个组件而无需构建其他组件，进而与随机梯度下降方法组合实现通用模型的无监督学习，从而在多个真实数据集上证明了其准确性的优势。

Abstract

In many settings, we have multiple data sets (also called views) that capture different and overlapping aspects of the same phenomenon. We are often interested in finding patterns that are unique to one or to a subset of the views. For example, we might have one set of molecular observations and one set of physiological observations on the same group of indi

发现论文，激发创造

剩余分量分析：在线性高斯模型中推广PCA以获得更灵活的推断能力

本文提出了一种新的基于残差方差的概率主成分分析(PPCA)模型——残差成分分析(RCA)，并探讨了由此框架产生的新算法，其中包括将高斯密度的协方差分解为低秩与稀疏逆两个部分的算法。作者在蛋白质信号网络恢复，基因表达时间序列数据集分析以及基于三维点云数据恢复人类骨架方面阐述了该模型的应用。

Jun, 2012

通过相关性在高维数据中发现结构

提出了一种层次逐步抽象表示复杂数据的学习方法，该方法基于优化信息论目标，通过最大化多变量互信息来搜索最佳解释数据相关性的潜在因素集合，该方法无需监督，不需要模型假设，并且随着变量数量的线性扩展具有可行性，我们证明了 Correlation Explanation (CorEx) 自动发现了来源于多个数据源的有意义的结构，包括个性测试、DNA 和人类语言。

Jun, 2014

无需主成分分析的主成分投影

该论文介绍了一个迭代算法，用于高效地将向量投影到矩阵的前几个主成分上，避免了对主成分分析（PCA）的显式计算，提供了对最流行的主成分回归问题的快速迭代方法。

Feb, 2016

理解基于潜在相关性的多视角学习和自监督：一个可识别性视角

本文旨在从潜在组件识别的角度理解基于最大化相关性的深度多视角学习，并采用一种直观的生成模型来分析多视角数据，它是共享和私有组件的不同非线性混合物，通过最大化潜在相关性，可以保证从各个视角提取共享组件（在一定程度上）并且还证明了通过适当的正则化设计，每个视图中的私有信息可以被明确地分离出来。

Jun, 2021

因果组成分析

介绍了一个名为Causal Component Analysis的问题，它可以作为Independent Component Analysis方法以及Causal Representation Learning方法的一个泛化，专注于学习解混函数和因果机制，并通过多个数据集的干预方法以及利用基于概率流的似然方法来确定CauCA的可识别性。

May, 2023

基于高阶累积量的潜在混杂因素因果发现

针对具有潜在混杂因素的因果关系发现问题，通过利用高阶累积量，提出一种基于独立分量分析的解决方法，可以自动检测潜在变量，确定因果顺序，并扩展到多个潜在变量的情况下。实验明确了该方法的正确性和有效性。

May, 2023

CCA Family的高效算法：无约束目标与无偏梯度

基于对CCA目标的随机梯度下降方法，提出了一种快速的多视图学习算法，能够在大规模数据中同时达到较快的收敛速度和更高的相关性，并能够在生物医学数据集和自我监督学习任务中取得卓越的表现。

Oct, 2023

深度广义典型相关分析再探

探索多个观测随机向量之间的潜在共变性的经典统计方法——典型相关分析(CCA)以及其扩展和变化在发现多视图数据集中的共同随机因素方面的能力。该研究设计了一种新颖高效的模型，适用于典型相关分析的深度扩展，并克服了现有方法的局限性，将私有组件建模为在给定共同组件的条件下条件独立，从而提供了一种更紧凑的表述形式。通过合成数据和实际数据的实验验证了我们的结论和方法的有效性。

Dec, 2023

多视图学习的贝叶斯联合加法因子模型

在精准医学领域，我们提出了一种联合加性因子回归模型（JAFAR），结合多种视图特征和依赖性收缩先验（D-CUSP），以提高时间至分娩开始的预测性能。

Jun, 2024

D-CDLF: 多视图高维数据的共同和独特潜在因子分解

联合分析多个高维数据视图的典型方法是将每个视图的数据矩阵分解为三个部分：由所有数据视图的共同潜在因素生成的低秩共同源矩阵，由对应数据视图的独特潜在因素生成的低秩独特源矩阵，以及一个附加噪声矩阵。现有的分解方法通常关注共同潜在因素与独特潜在因素之间的不相关性，但对来自不同数据视图的独特潜在因素之间的同样必要的不相关性的处理不足。我们提出了一种新的分解方法，称为共同和独特潜在因素分解（D-CDLF），以有效实现这两种不相关性，适用于双视图数据。我们还讨论了在高维设置下的D-CDLF的估计。

Jun, 2024