具加性父因果关系的结构复杂（SCARY）数据集

Apr, 2023

具加性父因果关系的结构复杂（SCARY）数据集

The Structurally Complex with Additive Parent Causality (SCARY) Dataset

Jarry Chen, Haytham M.Fayek

TL;DR本文提出了一种新类型的合成因果数据集 SCARY，包括 40 种情景、三个不同的种子和两种数据生成机制，可以帮助研究者在更现实的情况下探索因果推理。

Abstract

causal datasets play a critical role in advancing the field of causality. However, existing datasets often lack the complexity of real-world issues such as selection bias, unfaithful data, and →

causal datasets synthetic causal dataset selection bias confounding causal discovery

发现论文，激发创造

CausalPlayground: 应对前沿因果性研究中的数据生成需求

通过引入 CausalPlayground，我们解决了当前数据生成库的不足之处，提供了一个标准化的平台用于生成、采样和共享结构性因果模型，从而促进了该领域中更高效和可比较的研究。

May, 2024

阴影数据集：因果表征学习的新挑战性数据集

发现语义因素之间的因果关系是表示学习中的一个新兴话题。而多数因果表示学习（CRL）方法都是完全有监督的，但由于标注成本高昂，因此并不实用。为了克服这一限制，引入了弱监督的 CRL 方法。为了评估 CRL 性能，利用了四个现有数据集，即 Pendulum、Flow、CelebA (BEARD) 和 CelebA (SMILE)。然而，现有的 CRL 数据集只涉及到简单的图形和少量生成因素。因此，我们提出了两个全新的数据集，包含更多多样化的生成因素和更复杂的因果图。此外，当前的真实数据集 CelebA (BEARD) 和 CelebA (SMILE) 的原始因果图与数据集分布不一致，因此我们对它们进行了修改。

Aug, 2023

CausalChaos！动态视觉场景中基于较长因果链的综合因果行动问题解答数据集

利用卡通片的独特特性构建了新的挑战性因果 Why-QA 数据集 CausalChaos!，其中包含了较长的因果链并嵌入动态交互和视觉中，模型可以通过动画原理解决更具挑战性且明确定义的因果关系问题。同时，我们的研究还指出了更先进 / 明确的因果关系建模和视觉和语言的联合建模作为未来努力的重点领域。

Apr, 2024

复杂数据的生成建模

这篇论文提出了一种通用框架来合成更复杂的数据结构，其中包括复合和嵌套类型，并通过因果变换器构建了一种实际的解决方案，用于结构（类型映射）和列表（类型的重复实例），在标准基准数据集上的结果表明，这种方式的实现在机器学习实用性和统计相似性方面均明显优于当前最先进的模型，并且对于以前无法解决的具有多重嵌套和稀疏数据的两个复杂层次数据集表现出非常强的结果。

Feb, 2022

$ exttt {causalAssembly}$: 生成逼真的生产数据以进行因果关系发现的基准测试

本研究通过收集来自装配线的复杂数据集，建立了一个半合成制造数据的系统，通过分析其中的因果关系和使用 Python 库 causalAssembly 进行了多种因果推理算法的基准测试，以验证别人的因果关系学习算法在真实数据中的正确性和有效性。

Jun, 2023

从可识别的因果表征到可控的反事实生成：因果生成建模综述

深度生成模型在数据密度估计和有限样本数据生成方面取得了巨大成功。然而，它们存在无法解释性、倾向于引起虚假相关性和在超出分布范围的外推方面表现不佳等一些基本缺点。为了解决这些挑战，可以将因果性理论融入深度生成建模，结构因果模型可以描述数据生成过程并对系统中的变量之间的复杂因果关系和机制进行建模。因此，结构因果模型可以与深度生成模型自然地结合起来，给深度生成模型提供许多有益的属性，如分布偏移鲁棒性、公平性和互操作性。我们提供了一个因果生成建模的技术调研，将其分为因果表示学习和可控反事实生成方法两类。我们关注因果生成模型在公平性、隐私、超出分布泛化和精准医学方面的基本理论、形式化、缺点、数据集、度量和应用。我们还讨论了该领域未解决的问题和未来研究方向。

Oct, 2023

借助有效的非线性因果发现提升合成数据生成

本文设计了一种合成数据集生成器，用于生成能够在生成时间发现变量之间非线性因果关系的表格数据的合成数据集，并根据在常见模式中有效检索的特征限制因果发现，通过广泛的实验表明所提出的方法的有效性。

Jan, 2023

可控反事实推断的深度结构因果模型

利用深度学习组件建立结构因果模型 (SCMs) 的一个通用框架，采用正则化流和变分推断实现外生噪声变量的易处理推断，并验证其在 MNIST 和医学图像数据上的有效性，提出了 SCMs 可以回答所有 Pearl 因果逻辑的逆因果推断问题的思路。

Jun, 2020

从因果对到因果图

通过概率分布和因果关系特征，提出了一种计算效率高的因果结构学习方法，并在合成和真实数据集上进行了验证。

Nov, 2022

学习必要和充分的因果图

本文提出了一种能学习到只包含和我们感兴趣的结果相关的因果相关变量的必要和充分因果图（NSCG）的方法，该方法使用了因果关系的概率。我们开发了一个基于分数的算法来学习 NSCG，并在模拟和真实数据的实证研究中展示了该算法的性能优于现有算法，并能揭示对于目标可遗传特征非常重要的酵母基因。

Jan, 2023