We present an algorithm to identify sparse dependence structure in continuous
and non-Gaussian probability distributions, given a corresponding set of data.
The conditional independence structure of an arbitrary
该研究开发了一个框架,可用于从数据中学习稀疏的非参数有向无环图(DAG)。该方法基于最近对 DAG 进行的代数描述,该描述为分数为基础的 DAG 模型的学习提供了一个完全连续的程序,该程序通过线性结构方程模型(SEM)进行参数化。该框架适用于各种非参数和半参数模型,包括广义线性模型(GLMs)、加性噪声模型和索引模型等特殊情况。与现有方法不同,这个方法不需要特定的建模选择、损失函数或算法,它提供了一个完全通用的框架,可应用于一般的非线性模型和一般的可微分的损失函数,以及通用的黑盒优化例程。代码可在 https 网址处获得。
在高斯图模型的框架下,我们引入一种新颖的分解方法,将基础图结构分解为稀疏部分和低秩对角块(非重叠社区),并提出一个三阶段估计过程以及快速高效的算法用于识别稀疏结构和社区。通过两种建模方式展示了这种分解的重要性,并在理论层面上建立了局部可辨识性的条件,并通过构造一种有效的范数将传统的不可表示性条件拓展为自适应形式,确保自适应 l1 惩罚估计器在第二阶段的模型选择的一致性。此外,我们还为第三阶段的 K 均值聚类过程提供了聚类误差界限。通过大量的数值实验,证明了所提方法在估计图结构方面的优越性。此外,我们还将该方法应用于股票回报数据,展示了其准确识别非重叠社区结构的能力。
本文提出一种针对高维张量数据的估计和推断方法,通过假设数据遵循张量正态分布来简化精度矩阵的估计,使用交替迭代优化算法估计每个稀疏精度矩阵,并且提出一种去偏置统计推断方法来控制虚警率,实证结果证实了该方法在自闭症谱系障碍和广告点击分析等实际应用上的有效性,同时我们将其编码为一个名为 Tlasso 的公开的 R 包。