因果下游任务中的幻象与虚假

May, 2024

Smoke and Mirrors in Causal Downstream Tasks

Riccardo Cadei, Lukas Lindorfer, Sylvia Cremer, Cordelia Schmid, Francesco Locatello

TL;DR机器学习和人工智能有潜力改变数据驱动的科学发现，通过准确预测多种科学现象。本文通过对治疗效果估计的因果推断任务进行研究，其中假设记录为高维图像的二元效果是在随机对照试验中进行的。我们发现，尽管这是最简单的设置且完全适合深度学习，但在文献中的许多常见选择可能导致有偏估计。通过在昆虫（Lasius neglectus）对微粒应用的群体间进行的 RCT 记录的实际基准测试下游因果推断任务，从最先进的视觉骨干中微调了 6,480 个模型，我们发现抽样和建模选择显著影响因果估计的准确性，并且分类准确性不能作为此的代理。我们进一步在控制因果模型的合成生成视觉数据集上重复验证分析。我们的结果表明，未来基准测试应认真考虑真实的下游科学问题，特别是因果关系问题。此外，我们强调了用于帮助回答科学领域的因果问题的表示学习方法的指南。所有的代码和数据将会发布。

Abstract

Machine Learning and AI have the potential to transform data-driven scientific discovery, enabling accurate predictions for several scientific phenomena. As many scientific questions are inherently causal, this paper looks at the causal inference task of →

causal inference treatment effect estimation randomized controlled trial high-dimensional observations representation learning

发现论文，激发创造

针对任务的治疗效果估计实验设计

通过任务特定的实验设计和推导到定制特定下游应用程序的采样策略，我们提出了一种更节省样本数据的替代随机对照试验的方法，用于因果推断，并在各种重要任务，实际数据集和样本大小的情况下，胜过其他基准，例如需要一种数量级的数据才能在定向营销任务中达到随机对照试验的性能。

Jun, 2023

在线机器学习实验中的常见误解

本文讨论了机器学习模型在线实验所面临的问题，指出常用的 A/B-tests 并不能保证无偏估计。因此，文章提出了对从事此领域的从业人员和研究人员的影响及解决方案。

Apr, 2023

Downstream Treatment 效应估计的贝叶斯因果探索方法基准测试

通过实施强大的评估程序，我们评估了六种现有的基线因果关系发现方法和一种基于 GFlowNets 的新方法，用于治疗效果估计，并提供了有价值的洞察力，考虑了合成和真实世界场景以及低数据场景。此外，我们研究的结果表明，GFlowNets 能够有效地捕捉广泛有用和多样化的 ATE 模式。

Jul, 2023

更多的数据是你所需要的一切吗？一个因果探索

本文探讨了应用因果分析作为资源优化工具来开发医学成像机器学习应用的潜力。通过对合成数据集和糖尿病视网膜病变图像分析的实例研究，研究了数据集干预对图像分类模型输出的影响，以及需要在数据集中加入的数据量和类型以实现特定子任务的更好性能。

Jun, 2022

深度学习用于因果推断：异质处理效应估计体系结构的比较

通过开发一个全连接的神经网络，实现了 Bayesian Causal Forest 算法的神经网络因果推断架构，并将该方法应用于研究应激对睡眠的影响，展示了在模拟环境中性能的提升。

May, 2024

因果推断综述

本文综述了在潜在结果框架下，针对观察数据的因果推断方法。这些方法分为两类，包括传统的统计学方法和最新的机器学习方法，还介绍了这些方法在广告、推荐、医学等领域的应用以及常用的基准数据集和开源代码。

Feb, 2020

图神经网络用于治疗效果预测

使用图神经网络结合节点回归和消息传递机制，结合收集训练数据的策略，在大规模电子商务数据中实现对有限标记样本的因果效应估计。

Mar, 2024

因果推断分析性能评估基准框架

本文介绍了一个综合框架，用于对评估算法进行基准测试，它包括用于预测的未标记数据、用于验证的标记数据以及使用已建立和新颖指标进行算法预测的自动评估的代码，并解决了缩放和数据屏蔽问题。

Feb, 2018

使用多任务高斯过程进行个性化治疗效应的贝叶斯推断

基于电子病历的丰富性，本研究提出了一种基于多任务学习的方法来推断个性化治疗效果，使用非参数贝叶斯方法来学习治疗效果，同时提供置信度的点间可信区间，以实现精准医学，并证明该方法在早产儿干预社会计划和舒张期心脏病患者左心室辅助装置中明显优于现有技术。

Apr, 2017

随机对照临床试验中自动因果推断

本文提出了一种新的自动因果推断方法（AutoCI），该方法基于不变的因果预测（ICP）框架，可以对临床试验数据进行因果重新解释，并在两个真实的子宫内膜癌临床试验中有效地确定因果变量，证实 AutoCI 在临床分析中的鲁棒性和可行性。

Jan, 2022