培养人工智能和机器学习的信任并量化价值

Jul, 2024

培养人工智能和机器学习的信任并量化价值

Fostering Trust and Quantifying Value of AI and ML

Dalmo Cirne, Veena Calambur

TL;DR人工智能和机器学习提供商有责任开发有效可靠的系统。这篇论文探讨了处理机器学习的结果与用户信任之间的动态以及提出了度量系统可靠性的框架和指标。

Abstract

artificial intelligence (AI) and machine learning (ML) providers have a responsibility to develop valid and reliable systems. Much has been discussed about trusting AI and ML inferences (the process of running li

发现论文，激发创造

量化机器学习系统的可解释性和可信度

本文提出了一种量化解释性方法质量的量化度量，并在众包实验中通过信息传输速率得到了实证证据，从而说明解释性方法的价值。同时，还提出了一种信任度量，以检测人类决策是否过度偏向机器学习预测。

Jan, 2019

信任AI与可信机器学习技术之间的关系

本研究提供了一种系统的方法来将社会科学信任概念与建立在人工智能服务和产品上使用的机器学习技术相关联，探讨了四种类别的机器学习技术 (公平性、可解释性、可审计性和安全性) 如何影响人们的信任，并介绍了在 AI 系统生命周期的不同阶段建立信任的技术需求。

Nov, 2019

AI辅助决策中置信度和解释对准确性和信任校准的影响

研究了基于不同特征的人工智能辅助决策场景下，人类对人工智能的信任度与信任度校正，以及人类与人工智能协同工作的影响因素。结果表明，人类信任度的校正能够通过特定的置信度得到有效提高，尽管人类的专业独特知识对于决策的最终结果有良好的辅助作用，但同时也存在着使用本地解释会出现的问题。因此，我们需要探索新的可信度解释方法来更好地衡量和校正人类对人工智能的信任度。

Jan, 2020

自动化机器学习系统的建立信任信息需求探究

本文研究在自动化机器学习(AutoML)领域中的信任问题，发现在AutoML工具中包含透明度特性可以增加用户的信任和理解度，其中模型性能指标和可视化是建立用户信任AutoML工具时最重要的信息。

Jan, 2020

误信：测量机器学习对人类决策的干扰

研究人员探究了人们在处理两项困难任务时，对机器学习（ML）建议的信任程度；他们发现，即使人们了解这些任务，并给出了表明该系统不自信的信息，但在执行大部分时间正确的任务时，人们也会相信错误的ML建议，并且提供了四种不同类型的系统信息可增加人们对建议的信任，并且数学和逻辑技能对于使用ML建议的决策者来说可能与ML一样重要。

May, 2020

人工智能的信任：解释性并非必要或充分，而黑盒交互是必要和充分的

人类如何信任人工智能及如何评估其可信度及可靠性这是应用机器学习中最为基础的问题。基于统计学习理论和社会视角，我们提出一种将人工智能作为工具的框架，即从区别人机信任与人机人信任的角度出发，运用行为证书来预测模型的行为并澄清了解释能力对于信任的贡献以及模型行为对于信任的重要性。

Feb, 2022

不要信任，总是验证：可信AI的路线图？

本文对基于人工智能技术的系统的可验证性与数据存在的偏差问题进行了讨论，并提出了可信AI所需满足的一些属性和模型。

Jun, 2022

可信机器学习

机器学习的可信度问题，主要关注可信机器学习、越界泛化、可解释性、不确定性量化和可信度评估等领域研究。

Oct, 2023

用户对不确定性下人工智能的信任的历时视角

人工智能系统的可靠性和决策呈现方式对用户建立AI系统的心理模型至关重要，现代自然语言处理系统常常不可靠，导致系统信任被削弱，研究发现用户对错误和不准确的信心估计会对信任和性能造成损害，并且这种损害缓慢恢复，这些发现凸显了用户面向的人工智能应用中测定是否信任该系统时校准的重要性。

Oct, 2023

机器学习分类器的自动可信度测试

提出了TOWER技术，它是第一个自动创建可靠性判断器的技术，该技术可以根据解释技术的输出自动评估与模型无关的文本分类器的可靠性。通过使用噪声数据获得的不可靠模型进行无监督学习，找到TOWER的最佳配置。在人工标记的可靠性数据集上评估TOWER，结果显示TOWER能够检测到可靠性的降低，但在与人工标记的数据集对比时效果不佳。初步实验结果表明我们的假设是有效和有前景的，但还需要进一步研究以更好地了解解释和可靠性问题之间的关系。

Jun, 2024