机器学习模型的可解释性：从数据适应性到用户感知

Feb, 2024

机器学习模型的可解释性：从数据适应性到用户感知

Explainability for Machine Learning Models: From Data Adaptability to User Perception

julien Delaunay

TL;DR该研究旨在生成能满足数据和用户要求的本地解释，以便解释已部署的机器学习模型。通过增强一种广泛使用的基于规则的解释方法、引入一种评估线性解释逼近模型适用性的新方法，并对两种对照解释方法家族进行比较实验，从而为任何模型生成可靠且用户可理解的解释方法提供了一种途径。此外，该研究通过用户实验评估了三种解释方法和两种不同表示形式的影响，测量用户在理解和信任方面对模型交互的感知。通过提升解释生成的质量，该研究对增强已部署的人工智能系统的透明度、可信度和可用性具有潜在的影响。

Abstract

This thesis explores the generation of local explanations for already deployed machine learning models, aiming to identify optimal conditions for producing meaningful explanations considering both data and user requirements. The primary goal is to develop methods for generating explana

explanation generation machine learning models rule-based explanation linear explanations user experiments

发现论文，激发创造

推荐系统中的文本解释和评价

本篇论文探讨了在自然语言处理和推荐任务中推断高质量执行操作和使解释具有可操作性的两个基本挑战，并通过证明解释性不以在两个应用中展示的卓越表现为代价的框架将人工智能应用实践的承诺变为现实。

May, 2022

部署中的可解释机器学习

本研究探讨企业机构如何使用可解释机器学习来提供给利益相关者洞察模型行为，发现目前解释主要面向机器学习工程师，而不是受到模型影响的最终用户，存在内外部利益相关者的差异。研究综合分析了当前解释技术的局限，提出了促进最终用户交互的可解释性目标框架，并讨论了相关的问题。

Sep, 2019

对解释的人类可解释性评估

研究探讨了通过对模拟响应、验证建议响应、确定建议响应的正确性并观察其输入变化等三项特定任务，来解释可解释的 AI 的互动可能。结果表明，特定的正则化可以用于优化可解释性，而一些共同点和设计原则也可能存在于解释的系统之间。我们的结果表明，认知块比变量重复更影响表现，并且这些趋势在任务和领域中保持一致。

Jan, 2019

不要把机器学习算法按可解释性排序！以用户为中心的性能和可解释性研究

通过两项用户实验，本研究旨在提供实证证据，以解决机器学习算法的性能和可解释性之间的权衡问题，并发现其在最终用户的感知中的权衡程度相对较低，其取决于数据复杂性等情况，并根据第二项实验的结果，也发现了可解释性人工智能的增强手段是提高解释性的一种途径，但解释的类型对最终用户的印象起着至关重要的作用。

Jun, 2022

解释解释：机器学习的可解释性概述

有关解释人工智能的最佳实践和挑战的调查表明，现有的解释方法尤其是对于深度神经网络而言不足以提供算法的公正性、数据偏见和性能。

May, 2018

模型准确性和解释透明度如何影响用户信任

研究表明，在机器学习中，准确度比可解释性更重要，添加解释可能会损害用户信任，同时高度真实的解释不能欺骗用户的信任，用户的信任感与其实际表现不符。

Jul, 2019

深度学习中的解释方法：用户、价值、关注点和挑战

该文章主要探讨了解释性人工智能的问题，介绍了不同用户对于该领域的关注点，分析了欧盟的数据保护条例在深度神经网络中的适用情况，提出了现有解释方法的分类法，并探讨了如何解决用户对于数据集偏差导致的不公平及数据本身的不公的疑虑。

Mar, 2018

重新思考用户研究设计以评估模型解释

该研究通过一个众包实验，探讨解释机器学习模型的预测对人类是否具有帮助，并发现在给定特征系数的情况下，人们能够更有效地对线性词袋模型进行操纵，但解释对 BERT 型分类器并没有显著提高操纵能力，而通过伪造 BERT 模型的线性模型的对全局归属的解释则可以有效地操作 BERT 型模型。

Dec, 2021

使人工智能更易解释的不同方法学综述

人们对越来越多的决策由机器完成的需求增加，但黑盒模型的决策推理令人不解，因此需要关注决策推理的清晰度与可解释性，以及如何扩展到反事实思考。

Nov, 2023

评估解释的统一框架

评估可解释性模型的统一框架是该论文的重点，它介绍了各个研究群体对解释性评估的重叠和语义错位，并提出了解释的可行性和可理解性的评估标准，以及基于可解释神经网络的学习行为预测的案例。

May, 2024