评估机器学习模型的本地可解释性

Feb, 2019

评估机器学习模型的本地可解释性

Assessing the Local Interpretability of Machine Learning Models

Dylan Slack, Sorelle A. Friedler, Carlos Scheidegger, Chitradeep Dutta Roy

TL;DR本文探讨了人们对计算机可解释性的两个定义，即可模拟性和 “what if” 局部解释性。其中，通过对 1000 名参与者进行用户研究，我们测试了人类是否能够在通常被认为是局部可解释的模型上模仿可模拟性和 “what if” 局部可解释性的定义，并发现运行时间操作计数与局部解释性任务的准确性呈负相关关系。此外，我们发现决策树和逻辑回归模型相比于神经网络模型，是更加容易被解释的模型。

Abstract

The increasing adoption of machine learning tools has led to calls for accountability via model interpretability. But what does it mean for a machine learning model to be interpretable by humans, and how can this

machine learning interpretability simulatability local explainability user study

发现论文，激发创造

对解释的人类可解释性评估

研究探讨了通过对模拟响应、验证建议响应、确定建议响应的正确性并观察其输入变化等三项特定任务，来解释可解释的 AI 的互动可能。结果表明，特定的正则化可以用于优化可解释性，而一些共同点和设计原则也可能存在于解释的系统之间。我们的结果表明，认知块比变量重复更影响表现，并且这些趋势在任务和领域中保持一致。

Jan, 2019

操纵与测量模型可解释性

在高风险领域中，机器学习模型已经被广泛用于辅助决策，而开发可解释的模型的兴趣逐渐增加。然而，是否这些模型能实现预期的效果，我们缺乏实验研究来证明。本研究开展了一系列预先注册的实验，展示了具有不同要素的模型，以调查它们的可解释性。结果表明，模型越透明、特征越少，参与者越能成功地模拟模型的预测，但是参与者并没有更加倾向于紧密关注其预测，而拥有透明的模型却使参与者因信息过载难以检测和修正模型的重大错误。这些结果强调了开发可解释模型时实验测试的重要性。

Feb, 2018

评估可解释 AI：哪些算法解释有助于用户预测模型行为？

本文研究机器学习模型的解释方法对模型可解释性方面的影响，通过两类涉及文本和表格数据的模拟测试，评估了五种解释方法的有效性，表明模型可模拟性在分类表格方面使用 LIME 可以得到改善，而我们的 Prototype 方法在反事实的模拟测试中也是有效的。本文的结果显示，我们需要对评估解释方法的指标进行谨慎处理，并且当前方法仍有很大的改进空间。

May, 2020

机器学习中的可解释性：与解释性、预测性能和模型的相互作用

最近，解释性已经引起了机器学习领域的关注，因为在关键决策或故障排除时至关重要。本文阐述了解释性的关系，即与机器学习中的重要概念（如可解释性，预测性能和机器学习模型）的关系，以澄清对解释性存在的一些误解。

Nov, 2023

机器学习预测的局部和全局可解释度度量

本文提供了一种新颖的量化指标框架，用于解释分类器和回归模型的预测结果，旨在提高人工智能系统的透明度和可信度。应用公开数据集，展示了这些指标如何更全面地理解模型预测，并在决策者和利益相关者之间促进更好的沟通，从而增加人工智能系统的整体透明度和问责度。

Feb, 2023

本地与全局可解释性：一个计算复杂性角度

使用计算复杂性理论评估机器学习模型的局部和全局解释性，证明了局部和全局解释之间的对偶性以及某些全局解释形式的独特性，并比较了线性模型、决策树和神经网络在计算解释复杂度方面的差异。

Jun, 2024

解释型自然语言处理的本地解释概览

研究探讨了提高深度神经网络在自然语言处理（NLP）任务中的可解释性的各种方法，包括机器翻译和情感分析，并对术语 “可解释性” 及其各个方面进行了全面讨论。这项工作列举了与局部解释相关的各种方法，并将其分为三类：1）通过相关的输入特征解释模型的预测；2）通过自然语言解释进行解释；3）探查模型和单词表示的隐藏状态。

Mar, 2021

机器学习模型本地可解释性的真实元解释

本文探讨了如何提高复杂机器学习系统的可解释性，通过介绍采用基于诚实度的指标的局部元解释技术，给出了一个可行的解决方案。

Dec, 2022

可解释机器学习技术

本文综述了提高可解释机器学习模型的技术，并讨论了未来研究的关键问题，如设计用户友好的解释和开发全面的评估指标，以进一步推动可解释机器学习的发展。

Jul, 2018

模型解释性的神话

本文探讨了监督机器学习模型的解释能力，发现解释能力的动机与方法存在多样性和不一致性，因此提出了透明度与后期解释等多种方法，并怀疑线性模型易于解释而深度神经网络不易解释这一流行观点。

Jun, 2016