深度代理因果学习及其在混淆赌博机策略评估中的应用
从代理变量中检测潜在混淆因素是因果效应估计中的一个重要问题。我们提出了一种新颖的代理混淆因子分解(PCF)框架,用于处理通过高维、混合型代理变量表现出来的连续处理效应估计。
Mar, 2024
本研究提出了一个基于代理变量的框架,通过观测因果发现算法估计两个静态实体之间的因果关系,并将其应用于自然语言中的词汇对,结果显示我们的方法可以发现 75%的因果关系并讨论了代理变量在机器学习中的作用。
Feb, 2017
本文提出了一种正式的潜在结果框架,用于接受不完美的代理变量并解决观察性研究中因未测偏差而引起的因果推断问题。通过引入足够的条件来实现非参数识别,并给出了相应的算法进行估计,其中包括对点处理和时变处理设置的处理,以及给出了使用近端 g 计算方法计算因果效应的应用案例。
Sep, 2020
本文介绍了一种在存在连续变量的情况下发现因果关系的方法,通过解决离散数据的严格级别约束限制的问题,把连续因果关系测试转换为每个区间内离散因果关系的测试,这些非参数规则可以广泛适用于大量结构因果模型。
May, 2023
我们提出了基于核的 DR 估计器,可以处理连续的处理方式,并通过充分性证明其正态形式是影响函数的一致近似。我们还提出了一种高效解决干扰函数的新方法,并以均方误差为指标进行了全面的收敛性分析,证明了我们估计器在合成数据集和实际应用中的实用性。
Sep, 2023
我们研究了领域适应问题,该问题是由于未观察到的潜在变量分布改变所导致的分布偏移。我们的适应方法采用了近端因果学习,一种用于估计因果效应的技术,适用于存在未观察到的混淆变量代理的情况。我们证明了代理变量允许在不明确恢复或建模潜在变量的情况下适应分布偏移。我们考虑了两种情况:(i)概念瓶颈:观察到一个额外的 “概念” 变量,它介导了协变量和标签之间的关系;(ii)多领域:有来自多个源领域的训练数据,其中每个源领域对潜在混淆变量有不同的分布。我们在这两种情况下开发了一种两阶段核估计方法,以适应复杂的分布偏移。在我们的实验证明,我们的方法优于其他方法,尤其是那些明确恢复潜在混淆变量的方法。
Mar, 2024
使用信息理论方法,针对目标的因果变量未观察到的情况下,开发了特征选取和工程技术,以利用影响目标数据的观察到的下游变量作为代理,从中获得稳定性提升的信息,并利用辅助训练任务提取稳定性增强信息。在合成和实际数据上展示了我们技术的有效性。
May, 2023