神经因果部分识别的一致性

May, 2024

Consistency of Neural Causal Partial Identification

Jiyuan Tan, Jose Blanchet, Vasilis Syrgkanis

TL;DRNeural Causal Models (NCMs) 是用于自动识别和部分识别因果效应的神经生成模型的研究。本研究证明了在具有连续和分类变量的一般情况下，通过 NCMs 进行部分识别的一致性，并强调了神经网络架构的设计、深度和连接性以及训练阶段应用 Lipschitz 正则化的重要性。

Abstract

Recent progress in neural causal models (NCMs) showcased how identification and partial identification of causal effects can be automatically carried out via training of →

neural causal models causal effects neural generative models consistency lipschitz regularization

发现论文，激发创造

具有因果关系图约束的神经网络：一种新的治疗效应估计方法

近年来，对使用机器学习技术估计治疗效果的兴趣逐渐增长。本文讨论和分类了这些模型的算法归纳偏差，并提出了一种考虑因果图中的附加信息的新模型 NN-CGC，通过对模型实施新的约束，解决了来自虚假变量相互作用造成的偏差，并且可以与其他表征学习方法集成。我们使用三种不同的基础模型对我们的方法进行有效性测试，结果表明，我们的模型约束带来了显著的改进，在治疗效果估计方面取得了最新的全球领先成果。我们还展示了我们的方法对不完整因果图的鲁棒性，并且使用部分因果信息要优于忽略它。

Apr, 2024

因果模型的泛化和适应性能

本文研究了神经因果模型在零样本和小样本情况下的性能，并将其与单体模型和结构模型进行比较，其中预测变量的集合没有被限制为因果父节点。研究发现，相对于其他模型，因果神经模型在低数据量情况下具有更好的零样本和小样本适应性，并提供了稳健的泛化能力。此外，研究发现，比起更密集的图，对于更稀疏的图，这种效果更为显著。

Jun, 2022

将图神经网络与结构因果模型相关联

本文通过建立结构性因果模型和应用图神经网络模型，提出了一种新的因果推断方法，并证明了该方法可以用于因果效果辨识。

Sep, 2021

神经因果表示的摊销学习

本文提出了一种名为因果关系网络的算法，采用神经网络学习因果模型，并使用连续表示方法表示因果模型，从而更好地处理大量变量和利用先前的知识帮助学习新的因果模型，同时提出一种基于解码的评估指标。在合成数据的测试中取得了高精度和快速适应新因果模型的效果。

Aug, 2020

可识别的隐含神经因果模型

潜在维度加性噪声模型和潜在后非线性因果模型中的分布转变在因果表示学习中发挥重要作用，能够确定因果表示的可辨识性条件，并将其转化为实际算法，从而获得可靠的潜在因果表示。

Mar, 2024

多视角因果表示学习与部分可观测性

我们提出了一个统一的框架来研究从同时观察到的多个视图（如不同的数据模态）中学习到的表征的可识别性。我们允许部分观察的设置，其中每个视图都由一些潜在变量的子集的非线性混合构成，这些潜在变量可以有因果关系。我们通过对比学习和每个视图的单个编码器证明，任意数量的视图的所有子集共享的信息可以通过平滑双射进行学习。我们还提供了图形判据，指示哪些潜在变量可以通过一组简单的规则进行识别，我们称之为可识别代数。我们的总体框架和理论结果统一并扩展了关于多视图非线性 ICA、解缠和因果表示学习的几项先前工作。我们在数字、图像和多模态数据集上实验证实了我们的论述。此外，我们证明了我们设置的不同特殊情况下先前方法的性能可以得到恢复。总的来说，我们发现在部分可观察性的一般性较弱的假设下，获取多个部分视图有助于识别更精细的表征。

Nov, 2023

条件生成模型足以从任何因果效应估计中进行抽样

通过条件生成模型的向前推导计算，我们展示了对于任意可识别因果效应的计算。基于此结果，我们设计了一种扩散基础的方法，在图像数据上从任意（条件）干预分布中采样。作为算法的应用，我们通过分析虚假相关性的强度和解耦的水平，对预先在 CelebA 数据集上训练的两个大型条件生成模型进行了评估。

Feb, 2024

利用独立因果机制原理学习鲁棒模型

本文提出一种基于独立因果机制（ICM）原理的新梯度学习框架，理论和实验结果表明，这种学习方法可以在训练时利用不同环境之间的分布偏移，使神经网络更加鲁棒，并成功地找到与环境无关的关系，达到了对不稳定环境的泛化能力。

Oct, 2020

非线性潜在层次模型的识别

本文研究了非线性潜在变量的分层因果模型的识别问题，并证明在一些缓和的假设下，可以实现因果结构和潜在变量的可识别性。

Jun, 2023

曲率敏感模型的连续结果部分反事实识别

本文提出了一种新的敏感度模型 —— 曲率敏感度模型，与传统方法相比，该模型可以实现连续结果的部分反事实证明，并且可以通过对函数的级集进行曲率限制来获得信息，同时还提出了一种 Deep generative model 模型，并通过实验证明了该方法的可行性。

Jun, 2023