治疗效果估计的最优传输
基于观察数据的异质治疗效应 (Heterogeneous treatment effect, HTE) 估计面临治疗选择偏差的显著挑战,现有方法通过在潜在空间中最小化治疗组之间的分布差异来解决这一偏差,但通常忽视了类似单元具有相似结果的有益特性。本研究提出了基于局部接近度的反事实回归 (Proximity-aware Counterfactual Regression, PCR) 方法,以在 HTE 估计背景下利用接近度进行表示平衡。具体而言,我们引入了基于最优传输的局部接近度保持正则化器来描述差异计算中的局部接近度。此外,为了克服维度灾难,该灾难导致了差异估计的低效性,而 HTE 估计的数据可用性有限更是加剧了这一问题,我们发展了一个信息丰富的子空间投影器,以在改进样本复杂性的同时权衡最小距离精度。大量实验证明,PCR 能够准确地匹配不同治疗组的单位,有效地减轻治疗选择偏差,并显著优于竞争方法。代码可在此 https URL 中获取。
Jul, 2024
针对构建有效的推荐系统的基本研究问题,本文提出了一个称为整个空间反事实多任务模型(ESCM2)的原则方法,该方法使用反事实风险最小化器一次处理两个问题以处理数据稀疏问题和保证 CVR 估计的无偏性。该方法证明了 ESCM2 优于基线模型。
Oct, 2022
通过优化传输加权框架和对对照预测误差进行泛化边界,我们提出了一种估计长期异质剂量响应曲线的方法,以适应存在未观察混淆因素的观察数据,并对连续治疗的异质效应进行准确预测的理论基础进行建立。
Jun, 2024
通过将 Counterfactual Explanations 方法扩展到分布情境,引入了分布式 Counterfactual Explanation(DCE)的概念,该方法通过优化问题来推导一个与事实相吻合并具有统计置信度的反事实分布。同时,通过一系列案例研究验证了该方法在深入理解决策模型方面的潜力。
Jan, 2024
本篇研究提出了一种基于符合性推断的方法,用于在潜在结果框架下产生反事实和个体治疗效果的可靠区间估计,适用于完全随机或分层随机试验,以及遵循强忽略性假设的一般观测研究。同时,该方法在机器学习算法的条件平均治疗效应估计上表现出了良好的优势。
Jun, 2020
基于灵活的时间空间网格划分技术,本研究提出了一种以连续熵平衡为基础的因果连续处理的时空熵平衡方法(TS-EBCT),经过实验证明,在城市货运领域应用 TS-EBCT 方法后,因果效应的预测准确性显著提高,为公司的补贴和定价策略带来良好的商业利益。
Dec, 2023
我们的研究提出了一种集体方法来制定反事实解释,强调利用个体的当前密度来提供推荐行动,这种方法通过解决最优输运问题,在改进经典反事实解释的同时支持其提案,通过数值模拟验证了该方法的有效性及其与经典方法的关系。
Feb, 2024
本文章提出了一种新的方法来估计高维中两个概率分布之间的 Wasserstein 距离和最优传输方案,该方法可以在各种任务中获得显著的改进,包括单细胞 RNA 测序数据的领域适应性。该方法基于低运输秩的耦合,解决了数据驱动最优传输中的维数灾难,并得到了理论分析的支持。
Jun, 2018
本文提供了针对丰富的数据环境中的各种处理效应,包括局部平均处理效应(LATE)和局部分位数处理效应(LQTE)的高效估计量和诚实置信区间。 我们的框架涵盖了处理的内生接收,异质性处理效应和函数值结果等特殊情况。
Nov, 2013