Jun, 2024

CAT: 可解释的基于概念的 Taylor 叠加模型

TL;DRCAT 是一种新颖的可解释的基于概念的 Taylor 加性模型,通过将输入特征简单地归类为广泛的组别,无需领域专家标注概念和其真实值,从而在多个基准测试中证明了其超过或与基准方法竞争的性能,同时减少对大量模型参数的需求,并能够通过人类可以理解的高级概念解释模型预测。