因果推断和半参数统计的约束学习
利用神经网络适应目标学习技术提出的一种新的网络干扰下的双重稳健因果效应估计器,通过将理论条件转化为有针对性的损失函数,保证了估计器的双重稳健性,并通过理论分析揭示了与单一干扰模型相比更快的收敛速度。通过对两个现实世界网络上的半合成数据进行广泛的实验,证明了我们提出的估计器的有效性。
May, 2024
我们引入了高效的插件(EP)学习,这是一种用于估计异质因果对比的新框架,如条件平均治疗效应和条件相对风险。EP 学习框架具有与尼曼正交学习策略相同的洞察效率,同时解决了它们的一些主要缺点,包括实际适用性受损于损失函数的非凸性,以及逆概率加权和违反界限的伪结果可能导致性能差和不稳定性。为了避免这些缺点,EP 学习器构造了一个用于因果对比的种群风险函数的高效插件估计器,从而继承了像 T - 学习这样的插件估计策略的稳定性和鲁棒性特性。在合理条件下,基于经验风险最小化的 EP 学习器是洞察效率的,具有与种群风险函数的洞察效率单步去偏估计的最小化器等价的渐近等价性。在模拟实验中,我们证明了条件平均治疗效应和条件相对风险的 EP 学习器优于最先进的竞争对手,包括 T - 学习器、R - 学习器和 DR - 学习器。我们的 R 软件包 hte3 提供了所提出方法的开源实现。
Feb, 2024
通过分析最小二乘估计器的变体,,提出了一种半参数噪声估计算法,可以解决具有偏差,半参数噪声的估计问题,同时可以应用于部分观测线性系统参数的估计,且对于长期依赖问题的方差引入具有可减少的能力.
Feb, 2019
提出了一种在现代数据丰富的环境中估计未观察到的混杂影响下的平均处理效应的新框架,该框架具有大量的单位和结果。该提出的估计器具有双重鲁棒性,结合了结果填充、逆概率加权和用于矩阵补全的新型交叉拟合程序。我们推导出有限样本和渐近保证,并且证明新估计器的误差以参数速率收敛到均值为零的高斯分布。模拟结果显示本文分析的估计器的形式性质的实际相关性。
Feb, 2024
本文提出了一种新方法,双重机器学习 (Double ML),用于解决因变量的原因关系,利用多种主要和辅助机器学习预测模型解决辅助和主关键参数预测,通过 K 折采样交叉拟合解决过拟合问题。
Jul, 2016
本文提供了一个通用框架,用于校准涉及干扰估计的预测器,并使用所谓的 Neyman 正交概念证明了对于任意损失函数,任何因果参数估计的校准误差上界,进而分析了两种样本分割算法在因果校准中的收敛性。
Jun, 2024
本文提出了一种基于双无偏机器学习 (DML) 的非参数推断方法,用于连续治疗变量的因果效应估计,同时解决了无遗漏条件和非参数 / 高维麻烦参数的问题,并通过利用基于核的双重稳健矩函数和交叉拟合提供了高级条件,以实现估计的无偏性。
Apr, 2020
本文综述了半参数理论和因果推断问题中出现的经验过程等重要方面,并讨论了半参数模型下因果效应的估计和推断、经验过程理论及其与机器学习等方法在因果推断分析中的应用。
Oct, 2015
近年来,对使用机器学习技术估计治疗效果的兴趣逐渐增长。本文讨论和分类了这些模型的算法归纳偏差,并提出了一种考虑因果图中的附加信息的新模型 NN-CGC,通过对模型实施新的约束,解决了来自虚假变量相互作用造成的偏差,并且可以与其他表征学习方法集成。我们使用三种不同的基础模型对我们的方法进行有效性测试,结果表明,我们的模型约束带来了显著的改进,在治疗效果估计方面取得了最新的全球领先成果。我们还展示了我们的方法对不完整因果图的鲁棒性,并且使用部分因果信息要优于忽略它。
Apr, 2024