我们研究了基于表格数据训练的预测模型的全局事后解释的健壮性。预测模型中预测特征的影响是模型调试和应用科学中的重要诊断工具,然而它们在面对数据和模型扰动时的脆弱性仍然是一个未解决的研究问题。我们引入了一些理论界限来评估偏依赖图和累积局部效应的健壮性。我们的实验结果使用合成和真实数据集量化了(误)解释机器学习预测全局情况下最佳和最差情况之间的差距。
Jun, 2024
该研究提出了一种新的框架,称为广义加性分解全局效应(GADGET),用于找到特征空间中可解释的区域,从而尽量减少局部特征效应的交互异质性,并提出了一种新的置换检验方法来检测显著的特征交互。该方法在不同的实验设置中进行了实证评估,并使用两个真实世界的示例展示了其实用性。
Jun, 2023
提出了一种名为 “健壮且考虑异质性积累局部影响力 (RHALE)” 的解释性方法,旨在解决累积局部影响力(ALE)方法的两个局限性:无法量化局部效果与平均效果之间的异质性以及对特征域进行固定大小的分区时可能导致不一致估计的问题。通过使用标准差考虑局部效果的异质性和自动确定最佳分区,RHALE 方法在合成和真实数据集上的评估表明其优于其他方法,尤其是在存在相关特征的情况下,自动分区的优势得以体现。
Sep, 2023
本研究旨在解决机器学习模型预测个体实例时特征贡献和整体特征重要性的估计问题,提出了一种基于假设理想实验的因果效应定义,并构建了基于因果效应的透明且有意义的本地和全局解释方法,其数据驱动估计和实验验证表明了该方法的有效性及实用性。
Jun, 2022
介绍了 FMEs 方法及其首个软件实现 fmeffects 的相关理论背景、功能、处理方式、软件设计和未来扩展选项。
Oct, 2023
提出了一种名为积累局部影响(ALE)图的新的可视化方法,与 PD 图和 M 图相比,ALE 图不需要外推,并且不会因省略变量而产生偏差,它结合了 PD 图和 M 图的优点,是一种较少计算负担的数据可视化工具,用于对黑盒子监督学习模型进行主要因素和交互作用影响程度的可视化。
Dec, 2016
研究利用后处理的特征重要性方法来评估治疗效果估计器,通过建立基准环境,从而以往未被重视的新维度来研究个性化治疗效果模型的能力,以识别影响模型预测的特征,并提供有关处理效果模型的不同类型的优缺点的新见解。
本文提出了一种利用因果推断的方法实现自动化数据增强,从而减少机器学习模型学习特征和标签之间虚假相关性的问题,并在毒性数据集和 IMDB 评论数据集上得到了明显提升。
May, 2023
基于数据驱动的在线实验,提出了两种方法:使用考虑实验差异性的三层高斯混合模型来估计期望效应大小,以及基于效用理论来确定最佳效应大小,通过与基准方法的比较,表明了这些方法的卓越性能。
Dec, 2023
本文提供了针对丰富的数据环境中的各种处理效应,包括局部平均处理效应(LATE)和局部分位数处理效应(LQTE)的高效估计量和诚实置信区间。 我们的框架涵盖了处理的内生接收,异质性处理效应和函数值结果等特殊情况。
Nov, 2013