基于图神经网络的双机器学习估计网络因果效应
本文探讨了使用单个社交网络的观测数据进行因果效应的半参数估计和推断。在考虑样本大小增加时每个观测值对越来越多其他单位的依赖的同时,允许信息通过网络联系传输和节点共享网络联系的潜在相似性两种可能的依赖关系。提出了在社交网络环境下特别感兴趣的新的因果效应,如对网络联系和网络结构的干预,并用这种方法重新分析了使用 Framingham Heart Study 社交网络数据估计肥胖症因果同伴效应的一个具有影响力和争议的研究;在考虑网络结构后,我们没有发现因果同伴效应的证据。
May, 2017
通过对模拟数据和真实世界数据的性能比较,本文评估了一种名为 “双重 / 无偏机器学习”(DML)的方法,在估算因果效应时,使用机器学习放宽了传统假设的限制。我们发现,将灵活的机器学习算法应用于 DML 可以提高对各种非线性混淆关系的调整,从而避免了传统因果效应估计中通常需要的功能形式假设。然而,我们证明这种方法仍然严重依赖于因果结构和识别的标准假设。在我们的应用中,估计空气污染对房价的影响时,我们发现 DML 估计结果一直比不太灵活的方法估计结果要大。基于我们的整体结果,我们为研究人员在实际应用 DML 时提供了可行的建议。
Mar, 2024
利用神经网络适应目标学习技术提出的一种新的网络干扰下的双重稳健因果效应估计器,通过将理论条件转化为有针对性的损失函数,保证了估计器的双重稳健性,并通过理论分析揭示了与单一干扰模型相比更快的收敛速度。通过对两个现实世界网络上的半合成数据进行广泛的实验,证明了我们提出的估计器的有效性。
May, 2024
近年来,对使用机器学习技术估计治疗效果的兴趣逐渐增长。本文讨论和分类了这些模型的算法归纳偏差,并提出了一种考虑因果图中的附加信息的新模型 NN-CGC,通过对模型实施新的约束,解决了来自虚假变量相互作用造成的偏差,并且可以与其他表征学习方法集成。我们使用三种不同的基础模型对我们的方法进行有效性测试,结果表明,我们的模型约束带来了显著的改进,在治疗效果估计方面取得了最新的全球领先成果。我们还展示了我们的方法对不完整因果图的鲁棒性,并且使用部分因果信息要优于忽略它。
Apr, 2024
本文探讨了在因果推断和治疗效果估计中使用非结构化多模态数据(即文本和图像)的方法。我们提出了一种适应双机器学习(DML)框架,特别是部分线性模型的神经网络架构。我们还提出了一种新方法来生成半合成数据集,以评估在存在文本和图像混淆因素的情况下因果效应估计的性能。所提出的方法和架构在半合成数据集上进行了评估,并与标准方法进行了比较,突显了直接使用文本和图像进行因果研究的潜在好处。我们的研究结果对经济学、市场营销、金融、医学和数据科学等领域的研究人员和实践者在使用非传统数据估计因果数量方面具有重要意义。
Feb, 2024
通过开发一个全连接的神经网络,实现了 Bayesian Causal Forest 算法的神经网络因果推断架构,并将该方法应用于研究应激对睡眠的影响,展示了在模拟环境中性能的提升。
May, 2024
通过因果推断框架运用 Double Machine Learning(DML)估计混合模型,展示了在地球科学领域中估计因果参数的优势、对正则化方法偏差的鲁棒性以及避免等效多样性。该方法在碳通量配分中展现了适应异质因果效果的灵活性,并强调了明确定义因果图和关系的必要性,提倡这作为一般最佳实践,鼓励继续探索混合模型中的因果性以获得更可解释和可信赖的知识导向机器学习结果。
Feb, 2024
本文介绍并验证了一种关于干预和传染网络数据的简洁参数化方法(所谓链图模型),通过使用美国最高法院在 1994 年至 2004 年之间的案例数据和模拟数据对社交网络中的集体决策进行因果推断。
Dec, 2018