学习分解表示以进行因果推断
该论文提出用对抗训练来选择性平衡混淆因素,以解决观察研究中个性化治疗效应(ITE)估计的基本问题,并通过反事实推断帮助估计 ITE。在合成和真实世界数据集上的实证结果表明,该方法改善了现有方法,在 ITE 估计中实现了更低的误差。
Oct, 2022
本论文研究了工具变量回归中未测量混淆因素和观测混淆因素不平衡引起的混淆效应,提出一种混淆平衡的工具变量回归算法 (CB-IV) 来无偏估计治疗效应,进一步提高 CB-IV 的性能,扩展引入了潜在变量模块 (CB-IV-L),实验证明了 CB-IV (-L) 算法优于现有的方法。
Nov, 2022
从观察性文本数据中估计因果效应时,考虑潜在协变量的调整至关重要。然而,现有方法只考虑影响治疗和结果的混杂协变量,可能导致偏倚的因果效应估计。本研究旨在通过揭示不同变量之间的相互作用来解开估计文本因果效应时的非混杂协变量,从而减小偏倚。解开过程确保协变量只对各自的目标贡献,实现变量之间的独立性。此外,我们引入约束条件来平衡治疗组和对照组的表示,以减轻选择偏倚。在不同场景下,我们对两种不同处理因子进行实验,实验证明了我们提出的模型明显优于最近的强基线。此外,对收入电话会议记录的彻底分析表明,我们的模型能够有效解开变量,进一步的研究为投资者提供了决策指南。
Nov, 2023
本文介绍了在因果推断中使用加权重来实现预测功能的平衡,强调了确定合适的目标人群的重要性,并使用引理将平衡与倾向性评估的质量联系起来,最终展示了学习到的加权表示如何促进具有吸引力统计特征的替代因果学习过程。
Oct, 2020
我们提出了一种用于连续治疗的去混淆表示学习 (DRL) 框架,通过生成与治疗变量解耦的协变量表示来进行反事实结果估计。该框架是一个非参数模型,能够消除治疗与协变量之间的线性和非线性依赖关系,并在模型中嵌入了反事实推理网络以实现去混淆和可信的推理。在合成数据集上广泛实验表明,该 DRL 模型在学习去混淆表示方面表现卓越,并且胜过了针对连续治疗的最先进的反事实推理模型。此外,我们将该 DRL 模型应用于实际的医疗数据集 MIMIC,并展示了红细胞宽度分布与死亡率之间的详细因果关系。
Jul, 2023
利用分离表示学习的优势,提出了一种名为 DVAE.CIV 的新方法,用于从具有潜在混淆因素的数据中学习和分离 CIV 和其条件集的表示,并进行因果效应估计。对合成和真实世界数据集的广泛实验结果表明,与现有的因果效应估计方法相比,所提出的 DVAE.CIV 方法具有卓越的性能。
Jun, 2023
研究发现,处理观测数据的因果推断的主要难点是协变量的存在,虽然调整协变量可以削弱混淆效应,但错误的调整处理或包括不良控制变量可能导致偏差。为了解决这个问题,该研究开发了一种称为 Nearly Invariant Causal Estimation(NICE)的方法来处理协变量的调整,避免偏差并提供有效的因果推断。
Nov, 2020
对于决策制定来说,估计个体对不同治疗剂量的潜在反应至关重要,尤其在精准医学和管理科学领域。本文通过学习与治疗变量独立的协变量表示来预测反事实结果,然而,这种独立性约束忽略了对于反事实预测有用的大量协变量信息,特别是在治疗变量是连续的情况下。为了解决这个问题,本文首先从理论上证明了平衡和预测表示在无偏估计异质剂量响应曲线方面的重要性,即学习得到的表示需满足协变量与两个治疗变量及潜在反应之间的条件独立性。基于此,我们提出了一种新颖的对比平衡表示学习网络,使用部分距离度量,称为 CRNet,用于估计异质剂量响应曲线,同时不丢失治疗剂量的连续性。我们在合成和真实世界数据集上进行了广泛实验,证明了我们的方法显著优于之前的方法。
Mar, 2024