人机系统可解释性

Apr, 2019

Explainability in Human-Agent Systems

Avi Rosenfeld, Ariella Richardson

TL;DR介绍人-智能体系统中可解释性的分类法，并回答了解释性以及相关术语(包括可解释性、透明度、明确性和一致性)背后的基本问题，包括为什么需要解释性，对谁需要解释和可以生成什么解释来满足这种需求，并考虑什么时候应该向用户呈现这些信息以及如何使用客观和主观的措施来评估整个系统。

Abstract

This paper presents a taxonomy of explainability in human-agent systems. We consider fundamental questions about the Why, Who, What, When

发现论文，激发创造

人工智能中的解释性：来自社会科学的见解

该论文提出，可从解释生成、选择、评估和呈现的人类认知偏见和社会期望中借鉴人类解释行为，以推进可解释的人工智能领域，并回顾了哲学、认知心理学、社会心理学等相关领域的研究成果。

Jun, 2017

可解释人工智能的真正含义是什么？对于本质视角的新概念

本论文通过分析NIPS，ACL，COGSCI以及ICCV/ECCV论文标题的语料库来比较透明系统、可解释系统、理解系统和真正可以解释的系统之间的区别，并介绍了第四种概念：真正可解释的系统，其中自动推理是生成解释的关键步骤。

Oct, 2017

可解释性事实表：系统评估可解释方法的框架

本文介绍一种可用于描述和评估可解释系统的分类法和一组描述符，该分类法包括五个关键维度：功能性、操作性、可用性、安全性和验证性。通过对机器学习的文献进行调研，提取作者们提出或隐含使用的标准和期望，在此基础上提出了五个关键维度，并将其制成可操作的解释事实表格形式，以便于快速掌握特定解释方法的能力和局限性。此分类法可指导新的解释方法的开发。

Dec, 2019

可解释知识驱动系统基础

本文对可解释人工智能系统进行了历史概述，重点介绍了知识驱动的系统，在专家系统、认知助手、语义应用和机器学习领域的应用，提出了新的解释和可解释知识驱动系统的定义，以填补现有方法的不足并使解释更加用户和上下文关注。

Mar, 2020

标准化可解释性的必要性

本研究的目的是对可解释性（Explainable AI，XAI）领域的现状提供一个视角，并提供解释性和可解释性的新定义，以开始标准化这个研究领域。研究提供了可解释性文献的概述和现有方法的概述，最后提供了不同可解释性方法的初步分类法，为未来的研究打开了大门。

Oct, 2020

解释并非技术术语：XAI中的歧义问题

本研究探讨了可解释性人工智能（XAI）中说明的特征和其效用评估，强调了说明的功能角色、用户知识状态以及生成说明所需的信息的要求，并定义了XAI领域的重要下一步：建立指导和基础系统生成说明效用的度量标准，以避免XAI可能带来的对系统的信任而没有建立其可靠性。

Jun, 2022

关于AI解决方案的可解释性: 跨领域调查

该研究是对人工智能模型解释的广泛调查，发现解释决策和原因的不同方法和原因的异质性导致了个体解释框架。

Oct, 2022

自主教育结构情景下的可解释性

本文提出在教育结构化自主环境下进行决策过程中的可解释性概念，尤其强调了教育教师与学习者之间的稳健和迭代的基于解释的沟通的需求。

Oct, 2022

弥合明确人工智能与卢曼交际功能理论之间的鸿沟

本文利用Luhmann和Esposito的社会系统理论，探讨了可解释的AI在人工智能交互中需要面对的挑战以及应对之道，旨在通过系统论方法的应用，提供一个新的视角来理解可解释的人工智能的问题和限制。

Feb, 2023

AI政策中的可解释性：欧盟、美国和英国的沟通、报告、法规和标准的关键回顾

本文通过对欧盟、美国和英国政策文件的调查，针对可解释性人工智能的技术和社会影响进行了主题和缺口分析。发现政策通常基于对解释的粗略观念和要求。最终提出了一组关于如何解释AI系统的建议，其中包括定义、可行性、可用性以及分配解释提供者的责任。

Apr, 2023