关于解释不公正现象的概述

Feb, 2024

On Explaining Unfairness: An Overview

Christos Fragkathoulas, Vasiliki Papanikou, Danae Pla Karidi, Evaggelia Pitoura

TL;DR算法公平性和可解释性是实现负责任人工智能的基本要素。本文关注它们之间的相互关系，即最近受到越来越多关注的研究领域。我们首先提出了两种综合分类法，分别代表了公平性和解释两个互补的研究领域。然后，我们将用于公平性的解释分为三种类型：（a）用于增强公平指标的解释，（b）用于帮助我们理解（不公平）原因的解释，以及（c）用于辅助我们设计缓解不公平性方法的解释。最后，基于我们的公平性和解释分类法，我们提供了未曾涉足的文献路径，揭示了可以作为未来研究宝贵见解的空白领域。

Abstract

algorithmic fairness and explainability are foundational elements for achieving responsible AI. In this paper, we focus on their interplay, a research area that is recently receiving increasing attention. To this

algorithmic fairness explainability taxonomies fairness metrics future research

发现论文，激发创造

关于解释、公平感知和决策之间的关系

研究人员探讨了 AI 系统推荐错误或不公平的情况下，人工干预的必要性，并提供了关于解释、公平感知、依赖和分布公平性之间关系的理论框架，但文献并没有提供确凿证据证明解释在实践中实现了这种补充关系。

Apr, 2022

人工智能决策中的解释、公平性和适当依赖

研究了基于 AI 解释和分布式公平性之间的关系，发现解释会影响公平感知，从而与人类对 AI 建议的依赖关系发生关联。该研究表明，基于特征的解释并不是改善分布式公正性的可靠机制。

Sep, 2022

公平机器学习的可解释性

本文提出了一种新的基于 Shapley 值范例的机器学习公平解释方法，并提出了一种元算法来应用现有的训练时公平干预。

Oct, 2020

解释模型：解释对公正评判的影响的经验研究

通过一项关于程序生成解释的实证研究，我们发现不同类型的解释如何影响人们对机器学习系统的公平判断，其中某些解释可增强人们对算法公正性的信心，但也有部分解释会被认为是不公平的，此外，不同类型的解释也能更有效地揭示不同的公平问题，因此我们讨论了提供个性化和自适应的解释来支持机器学习系统的公平判断。

Jan, 2019

XAI 公平效益的关键调查

通过系统文献综述和定性内容分析，我们对可解释性人工智能（XAI）与公平之间的关系进行了深入调查，发现了公平福利的七个典型主张，并提出了对这些主张的重要注意事项。尽管文献经常暗示 XAI 是实现几个公平愿望的一种手段，但我们注意到这些愿望与 XAI 的能力之间存在不匹配，我们鼓励将 XAI 视为解决算法公平这个多维度社会技术挑战的工具之一，并具体说明哪种 XAI 方法如何使谁能够解决哪种公平愿望。

Oct, 2023

推荐系统中可解释的公平性

该研究基于可解释的 AI 技术，提出了一个计数事实可解释公平框架（CEF）来解决推荐系统中存在的公平性缺陷问题。该模型能够生成关于模型公平性的解释，以提供有关即使做出相关更改也不会显著损害其性能的公平性分数排名的信息。

Apr, 2022

公正与可解释性之间的相互作用

建立可靠且值得信赖的自然语言处理应用程序，模型需要在不同人群之间既公平又可解释。本研究通过两个文本分类数据集进行实验证明，公平和可解释性并不总是相互影响的，因此需要同时考虑这两个目标，以获得更好的结果。

Oct, 2023

采用以人为本的 AI 方法实现公平公正可解释 AI

本文探讨了机器学习中公平性、可解释性、人本主义、社会偏差等问题，并提出了一种以人为本的人工智能方法，以增强分类系统和单词嵌入的可解释性和公平性，通过 D-BIAS 等可视化工具识别和缓解社会偏见。

Jun, 2023

面向自然语言处理模型公平性的解释性方法应用挑战

本文简要回顾自然语言处理领域中解释性和公平性的研究趋势，识别出目前通过解释性方法来检测和减轻偏见的实践，调查 XAI 方法在解决公平问题方面广泛应用的障碍。

Jun, 2022

自动决策系统中的公平性和可解释性：计算机科学与法律的挑战

本论文针对算法决策中的公平性问题提供了跨学科的构想。其中，法律系统的差异是一个核心问题，同时论文提出了一种上下文方法来处理意外的群体歧视，研究算法决策的可解释性。

May, 2022