Jan, 2023

用因果抽象进行忠实的模型解释

TL;DR本文提出因果抽象理论作为高层次的 AI 模型解释的数学基础,使用因果抽象分析来确定可解释的高层次因果模型是否忠实反映了 AI 模型的行为和内部结构,同时我们还定义了近似因果抽象的概念以度量高层次因果模型对底层模型的抽象程度,并将 LIME、因果效应估计、因果中介效应分析、迭代零空间投影和基于电路的解释方法形式化为因果抽象分析的特例。