自动化双效原则
通过对模拟数据和真实世界数据的性能比较,本文评估了一种名为 “双重 / 无偏机器学习”(DML)的方法,在估算因果效应时,使用机器学习放宽了传统假设的限制。我们发现,将灵活的机器学习算法应用于 DML 可以提高对各种非线性混淆关系的调整,从而避免了传统因果效应估计中通常需要的功能形式假设。然而,我们证明这种方法仍然严重依赖于因果结构和识别的标准假设。在我们的应用中,估计空气污染对房价的影响时,我们发现 DML 估计结果一直比不太灵活的方法估计结果要大。基于我们的整体结果,我们为研究人员在实际应用 DML 时提供了可行的建议。
Mar, 2024
使用因果领域转移模拟决策支持系统的部署,并提供条件期望的新型跨领域识别结果,既可事前又可事后评估决策支持系统的部署,并通过重新训练模型评估在未部署决策支持系统情况下的风险,为多种形式的目标变量偏差提供了实用的统一解决方案。
Mar, 2024
DDE-Find 是一个数据驱动的框架,通过使用基于伴随法的方法来高效计算损失函数相对于模型参数的梯度,实现了从嘈杂且有限数据中学习 DDE 的首个完整框架。
May, 2024
本论文在神经延迟微分方程(Neural DDE)的基础上,提出了一种新的神经状态依赖延迟微分方程(SDDDE)的框架,该方法能更好地适用于包含多个状态依赖延迟的复杂系统,并在多种延迟动态系统的数据上显示了较高的性能。
Jun, 2023
应用机器学习方法解决高维数据下模型参数估计问题的方法被推广到了观测数据的平均处理效应估计,通过使用 Neyman-orthogonal scores 和交叉配对等技术进行设备参数的估计。
Jan, 2017
本文介绍了一种基于延迟微分方程(DDE)的连续时间神经网络方法,使用伴随灵敏度方法从数据中直接学习模型参数和延迟。该方法可以学习 DDE 参数,表现出良好的敏感性分析能力,并涉及到机器学习、动力系统学和神经网络等领域。
Apr, 2023
本文探讨了在因果推断和治疗效果估计中使用非结构化多模态数据(即文本和图像)的方法。我们提出了一种适应双机器学习(DML)框架,特别是部分线性模型的神经网络架构。我们还提出了一种新方法来生成半合成数据集,以评估在存在文本和图像混淆因素的情况下因果效应估计的性能。所提出的方法和架构在半合成数据集上进行了评估,并与标准方法进行了比较,突显了直接使用文本和图像进行因果研究的潜在好处。我们的研究结果对经济学、市场营销、金融、医学和数据科学等领域的研究人员和实践者在使用非传统数据估计因果数量方面具有重要意义。
Feb, 2024
在这篇论文中,我们采用最近引入的无结构统计下界框架,证明了双重稳健估计器在平均处理效应以及对待处理群体的平均处理效应方面的统计优越性,以及这些估计器的加权变体,这在政策评估中广泛应用。
Feb, 2024
本篇论文介绍了一种基于 agent assessment module 的 AI 系统执行高级指令序列并回答用户问题的方法,通过不同类别的查询来比较这种方法的计算要求和正确模型的学习所需的努力,并介绍了动态因果决策网络来捕捉 STRIPS-like 领域的因果结构。
Aug, 2021
通过因果推断的方法,评估延迟系统对预测准确度的因果影响,区别两种场景,一种是能够接触到人类和机器学习模型的预测结果,另一种是只有人类预测结果可用,通过这种方法在合成和真实数据集上对七种延迟系统进行了实证评估。
May, 2024