TL;DR本文旨在通过一种高效的 Oracle 和 MARCO 算法改进,提供一个最小的、满足成本函数的解释,以解释机器学习模型的预测,并对这些解释进行了研究和分析,以进一步了解它们的特点。
Abstract
The ability to explain why a machine learning model arrives at a particular
prediction is crucial when used as decision support by human operators of
critical systems. The provided explanations must be provably c
本文介绍一种基于强化学习技术的可解释人工智能方法,称为 McXai,以解释任何黑盒分类模型的决策。该方法使用 Monte Carlo 树搜索对生成解释的过程进行建模,并利用两个游戏来找到支持分类器决策的特征集合和导致替代决策的特征集合。最终呈现为一棵树形结构,每个节点表示一个要研究的特征集,能够找到比 LIME 和 SHAP 更具信息性的特征,并且能够指出误导特征,从而提高黑盒模型的鲁棒性。