- 增益来源:条件平均剂量反应估计中的性能分解
我们提出了一种新的分解方案,用于评估影响 CADR 估计器性能的五个不同组成部分的影响。我们运行了近 1500 个独立实验,将这个方案应用于四个广泛使用的基准数据集上的八个流行的 CADR 估计器。我们的结果揭示了大多数现有的基准数据集的挑 - 允许混淆的 LiNGAM 推广
通过引入 LiNGAM-MMI 方法,该论文增强了 LiNGAM 模型,使用 KL 散度量化混淆的大小并按照最小化其影响的方式排列变量,实现全局最优的变量顺序,同时在有和无混淆的情况下以与传统 LiNGAM 相同的高效性处理数据。
- AAAI使用梯度插值和核平滑的连续处理效应估计
通过对个体进行训练与推断逆因果结果的方法,改进了存在潜在相互影响的治疗分配与个体协变量之间的矛盾问题,提高了个体化连续治疗效果估计的准确性。
- 潜在类别混淆下的因果发现
使用有向无环图来建模系统的因果结构。在多个数据源(群体或环境)的数据聚合中,全局混淆模糊了许多因果发现算法中的条件独立性属性。因此,现有的因果发现算法不适用于多源设置。我们证明,如果混淆的基数有限(即数据来自有限数量的源),仍然可以实现因果 - RCT 因果估计评估的拒绝抽样
在高维变量的设置中,我们提出了一种新的采样算法 ——RCT 拒绝采样,通过使用随机控制试验(RCT)的平均因果效应作为基准真实值,并在观察数据中保证因果识别性,以便有效地评估机器学习方法在去除混淆时的表现,为因果估计的改进经验评估构建了基础 - 具加性父因果关系的结构复杂(SCARY)数据集
本文提出了一种新类型的合成因果数据集 SCARY,包括 40 种情景、三个不同的种子和两种数据生成机制,可以帮助研究者在更现实的情况下探索因果推理。
- B-Learner: 针对潜在混淆的异质因果效应准 - Oracle 界限
本研究提出一种称为 B-Learner 的元学习器,可以在隐含混淆的限制下有效地学习 CATE 函数的尖锐界限,该方法具有有效、尖锐和高效的性质,在更一般的条件下,其估计量具有拟神谕性质。
- 通过控制无关句的混淆效应来提高抽象摘要的忠实度
本文研究了文本自动摘要中的事实正确性问题,提出了减少混淆因素的多任务模型,并且实现了在 AnswerSumm 数据集上准确性和信实度均有提升。
- 混淆下的反事实生成
在机器学习中,当训练数据受到观测或未观测到的混淆影响时,生成的关系可能会与部署时相差较大。本文提出了一种基于因果生成过程的对抗性生成方法,以最小化生成因素之间的关联性,从而生成有效对抗性数据用于训练图像分类器,即使训练数据受到高度混淆的影响 - 个体治疗效果的敏感性分析:鲁棒的符合推断方法
提出了一种基于预测推断的模型自由框架,用于探究个体治疗效果的敏感性分析,特别关心了混杂因素强度量化和对于反事实的可靠预测推断。
- 聚合和细分治疗的政策评估:影响还是治疗异质性?
针对二元处理的蒙太奇方法的提出,用于发现掩盖的治疗异质性,同时通过基于双重 / 偏倚机器学习的估计和推断过程,来克服多个治疗方案的高维混淆、极端倾向得分等问题,并得出了不同烟草吸食量对出生体重不同的影响和求职培训方面存在的性别差异等因素。
- 深度离线策略评估的仪器变量回归
该研究探讨了在采用深度强化学习中估计状态行为值函数(Q 函数)时出现的混淆问题,以及如何运用因果推断学中的工具来解决混淆问题,并提供了一些性能良好的解决方案。
- 使用文本进行混淆因素调整:因果推断中的挑战和实证评估框架
该研究提供了第一个结合真实世界研究任务的文本因果推理方法的经验评估框架,评估了常用文本因果推理方法的优缺点,并公开任务、数据和模型,以促进应用和鼓励额外研究。
- 通过对抗平衡表示估算随时间变化的因果治疗结果
介绍了一种新的序列到序列模型 —— 对立逆向网络,该模型利用患者日常观察数据,通过对领域敌对训练来处理时间变化混杂物的偏见,以可靠地作出反事实预测。在肿瘤生长的模拟模型中,比目前最先进的方法在估计反事实和选择正确的治疗和治疗时间方面实现了更 - 核最优正交加权:连续处理效应估计的平衡方法
这篇论文采用 Kernel Optimal Orthogonality Weighting 方法,通过最小化惩罚函数协方差中的最劣情况来为评估连续性治疗的效果提供权重并应用其于血压与红肉摄入之间的关联分析。
- 使用因果森林估计治疗效果:一个应用
本研究使用因果森林(causal forests)对来源于《学习心态国家研究》的数据进行了分析,讨论了因果森林使用估计的倾向得分更加具有鲁棒性以及如何处理包含聚类误差的数据等实际和概念上的挑战。
- 消除混淆推荐器:推荐的因果推理方法
推荐系统通过因果分析的方法解决了推荐过程中潜在变量的干扰,引入去混淆因素的推荐模型成功地提高了推荐准确性。
- 通过频谱分析检测多元线性模型中的混淆
研究了 Y 与一组潜在导致 Y 的预测变量 X:=(X1,...,Xd)相关的模型,提出了一种推断 X 和 Y 之间的统计依赖程度的方法,该方法依赖于维数 d 较大的测度集中性结果和独立性假设
- 利用随机森林方法估计观测数据中的个体治疗效果
本研究旨在使用反事实框架结合随机森林 (RF) 来估计个体治疗效应,不受观察数据中共变量和选择偏差影响,并通过对比实验发现,针对共变量自适应的方法优于其他方法,以此揭示了药物使用与性风险之间的重要联系。
- 无需假设的敏感度分析
本文提出了一种新的敏感度分析方法,通过引入边界因素,避免了以往方法的强且不可验证的先验假设,仅需两个敏感参数,可以作为评估未观测到的混淆因素对因果推论影响的有力工具。