用于更好评估机器学习的因果推断工具

Oct, 2024

用于更好评估机器学习的因果推断工具

Causal Inference Tools for a Better Evaluation of Machine Learning

Michaël Soumm

TL;DR本研究解决了机器学习评估中缺乏严格统计方法的问题，通过引入经济计量学的关键统计技术，如最小二乘回归和方差分析，增强机器学习系统的分析与改进能力。研究结果表明，应用这些方法能够深入理解模型的行为与表现，促进更健壮和可解释的机器学习技术的发展。

Abstract

We present a comprehensive framework for applying rigorous statistical techniques from Econometrics to analyze and improve Machine Learning systems. We introduce key →

发现论文，激发创造

使用干预措施和实证数据评估因果模型的论证

本论文阐述因果推断对人工智能的重要性，分析了现有的评估技术和存在的局限，并提出采用干预措施和实际数据进行评估的方法，探讨了其可行性和优越性。

Oct, 2019

因果推断综述

本文综述了在潜在结果框架下，针对观察数据的因果推断方法。这些方法分为两类，包括传统的统计学方法和最新的机器学习方法，还介绍了这些方法在广告、推荐、医学等领域的应用以及常用的基准数据集和开源代码。

Feb, 2020

机器学习的因果可解释性：问题、方法和评估

本文综述了因果可解释模型的问题和方法，并深入探讨了用于衡量解释度的评估度量标准，从而帮助实践者了解每种评估度量标准适用于哪些场景。

Mar, 2020

因果学习算法的评估方法和度量

这篇综述文章介绍了以因果推断为基础的机器学习，阐述了该领域的研究重点、难点和局限，并提出了应对策略，旨在推动因果学习算法的发展和应用。

Feb, 2022

因果推断与机器学习中的工具变量方法：一项调查

介绍和讨论 IV 方法及其在因果推断和机器学习中的应用，主要包括两阶段最小二乘法、控制函数和 IV 评估；总结了实际应用场景中的数据集和算法，并讨论了未来研究的方向和问题。

Dec, 2022

假设检验与机器学习：使用Cohen的f2解释深度人工神经网络中的变量效应

本文提出了一种基于现有的可解释人工智能（XAI）方法的、适用于机器学习的无模型假设检验框架，其中利用 Fisher 的变量置换算法计算等效于 OLS 回归模型的 Cohen's f2 的效应量度量，并将 Mann-Kendall 检验和 Theil-Sen 估计器应用于 Apley 的累积局部效应图，以指定变量的影响方向和统计显著性。该方法在人工数据集和社会调查中得以证明其有效性。

Feb, 2023

机器学习研究的推断可再现性

本研究探讨了机器学习模型评估的可靠性，提出了使用线性混合效应模型的方法，以分析性能评估分数，并使用广义似然比检验进行统计推断。同时，本文还探讨了数据属性与算法噪声因素之间的相互作用，以及噪声源对整体方差的贡献和可靠性系数的计算方法。

Feb, 2023

我们真的需要数据吗？

以人工智能和机器学习为基础，本文研究了预测后推断问题的统计挑战，包括预测结果与真实结果之间的关系、机器学习模型对训练数据的鲁棒性以及将预测的偏差和不确定性传播到最终推断过程中。同时与传统领域的相关研究进行对比，揭示了设计在经典和现代推断问题中的作用。

Jan, 2024

解释机器学习性能差异的分层分解

解释机器学习算法在不同领域表现差异的新的非参数分层框架，提供了聚合和详细分解的方法，不需要因果知识，同时导出了消除偏差、计算高效的估算器和统计推断程序，以获得渐近有效的置信区间。

Feb, 2024

任务无关的机器学习辅助推理

通过机器学习辅助分析和统计学方法的结合，我们提出了一种新的统计框架，用于无任务限制的机器学习辅助推理，可有效实施预测后推理，适用于各种分析框架和实际应用。

May, 2024