使用平衡权重进行反事实表示学习
本文介绍了一种基于排列加权的方法,使用标准二元分类器来估计平衡权重,以实现观测因果推断。通过这种方法可以估计多种现有平衡权重,同时允许基于分类器损失的方法直接比较,并使用交叉验证进行超参数调整。实证评估表明,排列权重相对于现有的方法表现更为有利。
Jan, 2019
对于决策制定来说,估计个体对不同治疗剂量的潜在反应至关重要,尤其在精准医学和管理科学领域。本文通过学习与治疗变量独立的协变量表示来预测反事实结果,然而,这种独立性约束忽略了对于反事实预测有用的大量协变量信息,特别是在治疗变量是连续的情况下。为了解决这个问题,本文首先从理论上证明了平衡和预测表示在无偏估计异质剂量响应曲线方面的重要性,即学习得到的表示需满足协变量与两个治疗变量及潜在反应之间的条件独立性。基于此,我们提出了一种新颖的对比平衡表示学习网络,使用部分距离度量,称为 CRNet,用于估计异质剂量响应曲线,同时不丢失治疗剂量的连续性。我们在合成和真实世界数据集上进行了广泛实验,证明了我们的方法显著优于之前的方法。
Mar, 2024
通过在可观测数据集中消除不同的偏差,去偏协同过滤旨在学习一个无偏的预测模型。本文通过重新加权观测样本分布以适应目标样本的倾向得分来解决此问题。为了更好地满足因果平衡约束条件,作者提出了一种近似平衡函数的方法,并在再生核希尔伯特空间中证明了其更好满足因果平衡约束条件的能力。同时,作者提出了一种自适应平衡核函数的算法,并理论上分析了方法的泛化误差界。通过广泛的实验证明了该方法的有效性。
Apr, 2024
本文提出了一个新的算法框架来回答反事实问题,其将领域适应和表示学习的思想结合起来,并通过实证比较表明,我们的深度学习算法显著优于以前的现有技术,可以用于处理各种领域的观察研究数据的因果推断问题。
May, 2016
通过最大化因果推断精度的熵平衡算法,我们研究了在倒数概率得分加权框架下,观测原因推断中连续治疗的问题,并使用合成和真实数据展示出我们的算法比基线熵平衡算法更准确地估计因果效应。
Jul, 2021
本文考虑针对协变量的平衡,提出基于倾向得分的加权策略以平衡不同处理组间分布的协变量。并针对此类权重提出新的加权方案,即叠加权重,从而最小化此类平衡权重中加权平均治疗效应的渐进方差,同时具有良好的小样本平衡性质。最后,我们提出一种新的方法,可以实现任何选定协变量的均值的精确平衡。
Sep, 2016
提出了一个基于表示学习和样本重加权的误差界,针对因果推断和无监督域自适应问题,在设计转换下减少泛化误差的算法框架,与以往方法相比具有更好的效果并具有渐近一致性。
Feb, 2018
机器学习中公平性或鲁棒性的失败可能源于协变量、结果和辅助因素之间的不希望的依赖关系。数据平衡是缓解这些问题的常见策略,但往往无法选择性地消除任务的因果图中的不希望依赖关系,导致多种失败模式,甚至干扰正则化等其他缓解技术。因此,在进行数据平衡之前,考虑因果图是非常重要的。
Jun, 2024