Feb, 2024

机器学习模型的可解释性:从数据适应性到用户感知

TL;DR该研究旨在生成能满足数据和用户要求的本地解释,以便解释已部署的机器学习模型。通过增强一种广泛使用的基于规则的解释方法、引入一种评估线性解释逼近模型适用性的新方法,并对两种对照解释方法家族进行比较实验,从而为任何模型生成可靠且用户可理解的解释方法提供了一种途径。此外,该研究通过用户实验评估了三种解释方法和两种不同表示形式的影响,测量用户在理解和信任方面对模型交互的感知。通过提升解释生成的质量,该研究对增强已部署的人工智能系统的透明度、可信度和可用性具有潜在的影响。