通过学习有说服力的解释优化人工智能与人类的合作

Nov, 2023

通过学习有说服力的解释优化人工智能与人类的合作

Optimising Human-AI Collaboration by Learning Convincing Explanations

Alex J. Chan, Alihan Huyuk, Mihaela van der Schaar

TL;DR提出了一种协作系统，其中人类最终做出决策，同时给予模型以最佳机会进行解释并与其辩论，从而解决了机器学习模型在复杂决策中出现难以检测故障模式且能够无监督采取行动的挑战。通过使用协作方法，我们可以确保安全性，提高性能，并解决透明度和问责制方面的担忧，从而实现有效的决策。

Abstract

machine learning models are being increasingly deployed to take, or assist in taking, complicated and high-impact decisions, from quasi-autonomous vehicles to clinical decision support systems. This poses challenges, particularly when models have hard-to-detect failure modes and are ab

machine learning models complicated decisions collaborative system interpretable explanations efficient decision-making

发现论文，激发创造

利用解释桥接人工智能和人类

该研究论文提出了解释性机器学习方法来提高人类决策水平和人工智能协助决策效能之间的差距。

Mar, 2020

以解释为基础的决策：关于可解释人工智能在辅助决策中的角色的人类中心评估

最近的实证研究调查了可解释人工智能对人工智能决策的影响，识别了挑战并提出未来的研究方向。

Dec, 2023

为什么不两者兼顾？在人工智能协作中，通过不确定性来补充解释和自信心的作用

本研究进行实证研究，以确定不确定性估计和模型解释对用户对模型的信任和理解的影响，探讨如何将自信度纳入分析结果以提高决策求同的准确性。

Apr, 2023

通过鲁棒性和关键性，结合人工智能控制系统和人类决策支持

AI 控制系统和对抗性解释在增强学习中具有广泛的应用，可用于智能决策工具和训练框架，增强决策和解释的能力，并提供强大的防御能力。

Jul, 2024

领域专家与人工智能协作的解释性模型引导系统

在高风险领域（如医疗保健）中，为了有效实现人工智能（AI）系统与领域专家之间的合作，我们引入了一种解释模型引导系统，允许领域专家利用其领域知识来引导预测模型。通过结合基于数据和模型的不同类型解释和手动、自动数据配置方法，该系统提供了一个解释仪表盘，用于引导预测模型。通过三项广泛的用户研究，我们对以医疗保健为重点场景的模型引导系统进行了评估，研究结果强调了在模型引导过程中涉及领域专家的重要性，从而最终实现了人工智能与人类的改进合作。

May, 2024

TED: 教授人工智能解释其决策

本文介绍了一种名为 TED（Teaching Explanations for Decisions）的实用框架，它提供了能够匹配消费者心智模型的有意义的解释，通过两个例子的演示，表明这种方法的广泛性和有效性，同时无损准确性。

Nov, 2018

人类预测和机器学习模型解释中的欺骗检测案例研究

该研究利用欺骗检测作为实验平台，研究了如何利用机器学习模型的解释和预测来提高人类表现，并保持人类主体性。结果表明，机器预测的解释可以促进人类表现的提高，而这种提高与机器高性能的明确建议具有相似的效果。

Nov, 2018

评估 AI 模型与医疗保健专业人员之间的沟通差距：可解释性、实用性和信任的 AI 驱动临床决策

本文提供了一个实用的评估框架，用于可解释机器学习模型对于临床决策支持的贡献。研究揭示了 ML 解释模型的更加细致的作用，以及将其实用地嵌入临床背景的方法。该研究发现，尽管医疗保健专业人员普遍对解释持有积极态度，但对于一定比例的参与者来说，存在负面影响，如确认偏差、过度依赖模型和增加与模型的交互的努力。此外，标准的解释模型显示出支持对模型限制进行关键理解的能力有限。但是，我们发现了具有新的显著积极影响的效果，重新定位了临床背景下解释的作用：包括减少自动化偏差、解决模糊的临床案例（医疗保健专业人员对其决策不确定的情况）并支持获取新领域知识的经验不足的医疗保健专业人员。

Apr, 2022

欺诈性 AI 解释：创建和检测

研究了如何使用深度学习和现有工具来创建和检测欺骗性解释，发现欺骗性解释可以骗过人类，但可以使用机器学习方法检测，即使缺乏领域知识，也可以以无监督的方式推断解释的不一致性。

Jan, 2020

复杂人机协作任务中的解释生成联合心智建模

人与机器协作中，提出了一种基于可解释人工智能（XAI）框架的思维感知沟通技术，借助贝叶斯推理算法，机器建立了人类用户的层次化精神模型，并生成自身思维的解释，实验证明该方法显著提高了协作表现和机器被用户感知的程度。

Jul, 2020