高维下近似残差平衡:无偏基础下的平均处理效应推断
本文提出了一种用于高维协变量信息下随机实验治疗效果估计的风险一致回归调整的方法,并建议使用交叉估计方法来获得有限样本无偏的治疗效果估计,最后对自适应规范搜索和机器学习方法如随机森林或神经网络等进行了拓展分析。
Jul, 2016
研究调查了特定个体因果效应的度量 —— 条件平均处理效应(CATE)的估计和统计推断方法,使用线性模型定义 CATE 为这些线性模型的预期结果之间的差异,并通过高维线性回归方法进行一致性估计和统计推断,进一步使用双重 / 无偏机器学习(DML)和无偏 Lasso 技术减小偏差,通过模拟研究验证了方法的有效性。
Mar, 2024
本研究提出了一种名为 “后双重选择” 的新型估计方法和统一的有效推断方法,用于控制干扰因素对治疗效果的影响。该方法相对于标准后模型选择估计器的优点在于它允许控制点的不完美选择,并提供跨模型的有效置信区间。
Dec, 2011
针对高维线性回归模型的参数拟合问题,考虑基于 Lasso 惩罚的最小二乘估计器的置信区间和 p 值的构造及去偏的版本,进一步在随机设计模型的情形下进行研究,并提出了更优的平均检测功率的分析结果。
Nov, 2013
该研究探讨了在协变量数目较多的情况下,半参数估计平均处理效应的方法,建议研究人员除了报告点估计和标准误差外,还应该进行多种补充分析以评估估计可信度。
Feb, 2017
本文提出采用核平衡方法来进行匹配和加权处理以进行因果推断,并证明该方法对于评估处理后的平均效应具有偏差纠正作用。该方法旨在使处理组和对照组之间的非治疗可能结果的条件期望相等,其中采用核函数提取基函数集合使得在该基函数下加权后处理组和对照组具有相等均值。采用该方法可用于实现不需要对治疗分配机制进行任何模型假设的稳定反倾向得分的权重选择。
Apr, 2016
在关于两种处理方法的因果推断中,条件平均处理效应(CATEs)作为一种代表个体因果效应的数量起着重要角色,它被定义为在协变量条件下两种处理方法的期望结果的差异。本研究假设了两个潜在结果与两种处理方法的协变量之间的线性回归模型,并将 CATEs 定义为这两个线性回归模型之间的差异。我们提出了一种方法,用于在高维度和非稀疏参数下一致地估计 CATEs。通过假设 CATEs 的隐式稀疏性,我们展示了理论上的一致性等理想性质的实现性,即使不显式假定稀疏性。利用这种假设,我们开发了一种专门用于 CATE 估计的 Lasso 回归方法,并证明了估算量的一致性。最后,我们通过模拟研究确认了所提出方法的合理性。
Oct, 2023
研究中提出了一种可扩展的变分贝叶斯方法,用于对稀疏线性回归中高维参数的一个单一或低维子集进行统计推断,通过对干扰坐标进行均场近似和谨慎地对目标的条件分布建模,只需要预处理步骤,保留了均场变分贝叶斯的计算优势,同时确保了对目标参数以及不确定性量化的准确可靠推断,该算法在数值性能方面与现有方法相媲美,并且在估计和不确定性量化方面建立了伯恩斯坦 - 冯・米塞斯定理的相关理论保证。
Jun, 2024
提出了一种在现代数据丰富的环境中估计未观察到的混杂影响下的平均处理效应的新框架,该框架具有大量的单位和结果。该提出的估计器具有双重鲁棒性,结合了结果填充、逆概率加权和用于矩阵补全的新型交叉拟合程序。我们推导出有限样本和渐近保证,并且证明新估计器的误差以参数速率收敛到均值为零的高斯分布。模拟结果显示本文分析的估计器的形式性质的实际相关性。
Feb, 2024
本文提供了针对丰富的数据环境中的各种处理效应,包括局部平均处理效应(LATE)和局部分位数处理效应(LQTE)的高效估计量和诚实置信区间。 我们的框架涵盖了处理的内生接收,异质性处理效应和函数值结果等特殊情况。
Nov, 2013