用于更好评估机器学习的因果推断工具
本文综述了在潜在结果框架下,针对观察数据的因果推断方法。这些方法分为两类,包括传统的统计学方法和最新的机器学习方法,还介绍了这些方法在广告、推荐、医学等领域的应用以及常用的基准数据集和开源代码。
Feb, 2020
介绍和讨论 IV 方法及其在因果推断和机器学习中的应用,主要包括两阶段最小二乘法、控制函数和 IV 评估;总结了实际应用场景中的数据集和算法,并讨论了未来研究的方向和问题。
Dec, 2022
本文提出了一种基于现有的可解释人工智能(XAI)方法的、适用于机器学习的无模型假设检验框架,其中利用 Fisher 的变量置换算法计算等效于 OLS 回归模型的 Cohen's f2 的效应量度量,并将 Mann-Kendall 检验和 Theil-Sen 估计器应用于 Apley 的累积局部效应图,以指定变量的影响方向和统计显著性。该方法在人工数据集和社会调查中得以证明其有效性。
Feb, 2023
本研究探讨了机器学习模型评估的可靠性,提出了使用线性混合效应模型的方法,以分析性能评估分数,并使用广义似然比检验进行统计推断。同时,本文还探讨了数据属性与算法噪声因素之间的相互作用,以及噪声源对整体方差的贡献和可靠性系数的计算方法。
Feb, 2023
以人工智能和机器学习为基础,本文研究了预测后推断问题的统计挑战,包括预测结果与真实结果之间的关系、机器学习模型对训练数据的鲁棒性以及将预测的偏差和不确定性传播到最终推断过程中。同时与传统领域的相关研究进行对比,揭示了设计在经典和现代推断问题中的作用。
Jan, 2024
解释机器学习算法在不同领域表现差异的新的非参数分层框架,提供了聚合和详细分解的方法,不需要因果知识,同时导出了消除偏差、计算高效的估算器和统计推断程序,以获得渐近有效的置信区间。
Feb, 2024