立足于 FURM 框架之上 —— 评估医疗系统中公平、有用和可靠的 AI 模型

Feb, 2024

立足于 FURM 框架之上 —— 评估医疗系统中公平、有用和可靠的 AI 模型

Standing on FURM ground -- A framework for evaluating Fair, Useful, and Reliable AI Models in healthcare systems

Alison Callahan, Duncan McElfresh, Juan M. Banda, Gabrielle Bunney, Danton Char...

TL;DR使用人工智能（AI）指导患者护理或操作过程的影响是 AI 模型输出、基于该输出的决策制定协议以及参与方采取必要后续行动的相互作用。斯坦福医疗保健的数据科学团队开发了一种 “公平、有用和可靠 AI 模型（FURM）” 的机制，通过进行伦理审查来识别潜在的价值不匹配，通过模拟估计有用性，通过财务预测评估可持续性，以及通过分析来确定 IT 的可行性，设计部署策略，并推荐前瞻性的监测和评估计划，从而实现在部署之前估计其影响效果，以及在实时研究其影响效果。我们报道了对六个 AI 模型指导解决方案进行的 FURM 评估，以评估其潜在采用性的过程，涵盖临床和操作设置，每年可能影响数十个到数万个患者。我们描述了评估过程，总结了这六个评估，并分享了我们的框架，以使他人能够进行类似的评估。在我们评估的六个方案中，有两个已进入规划和实施阶段。我们的创新贡献，包括模拟估计的有用性、量化可持续性的财务预测以及进行伦理评估的过程，以及底层方法和开源工具，可供其他医疗保健系统进行可行的候选 AI 解决方案评估。

Abstract

The impact of using artificial intelligence (AI) to guide patient care or operational processes is an interplay of the AI model's output, the decision-making protocol based on that output, and the capacity of the

artificial intelligence patient care ai models ethical assessments healthcare systems

发现论文，激发创造

FUTURE-AI: 信赖与可部署医疗人工智能的国际共识指南

FUTURE-AI 指南是第一个国际共识框架，用于指导可信赖人工智能医疗工具的开发和部署，该指南基于 6 项可信 AI 原则和 28 项最佳实践，旨在增加 AI 技术在医疗实践中的接受度和应用。

Aug, 2023

医学成像负责任基础模型的伦理框架

医学影像领域的基础模型（FM）具有巨大潜力，但在临床实践中的部署需要广泛的道德考虑。本文旨在强调与基础模型相关的道德问题，并提出一个框架来指导其在医学中的负责任发展和实施。我们仔细研究了诸如患者数据隐私、偏见缓解、算法透明度、可解释性和问责制等道德问题。该提出的框架旨在优先考虑患者福祉，减轻潜在风险，并在 AI 辅助医疗保健中建立信任。

Apr, 2024

用于信任机器学习的公平可解释建模（FAIM）在医疗保健领域

我们提出了一个可解释的框架 - 公平感知可解释建模（FAIM），以提高模型的公平性，同时保持性能，通过交互界面从一组高性能模型中识别出一个 “更公平” 的模型，并推动数据驱动证据和临床经验的整合，以增强情境公平性。我们通过使用两个真实世界数据库（MIMIC-IV-ED 和 SGH-ED）在预测入院时减少性别和种族偏见方面展示了 FAIM 的价值。我们展示了针对这两个数据集，FAIM 模型不仅表现出令人满意的区分能力，而且通过广泛使用的公平度量指标显著减轻了偏见，胜过常用的偏见减轻方法。我们的方法展示了在不牺牲性能的情况下提高公平性的可行性，并提供一种邀请领域专家参与的建模模式，促进定制人工智能公平性的多学科工作。

Mar, 2024

利用估计目标框架提高人工智能 / 机器学习评估的有效性和实用性

使用改编自国际临床试验指南的估计框架，提出一种改进评估方法的方法，用于评估 AI 或机器学习模型的有效性和实用性，以揭示其潜在问题、原因和解决方案。

Jun, 2024

AAAI FSS-19: 人性化人工智能：人工智能模型和数据的可信度研究论文集

研究旨在提高人工智能系统的可信度和信任度，开发能够适应实际应用场景的人工智能系统，并将人类放在其中心地位，使其能够有效地使用系统，理解输出和解释结果以满足监管委员会的要求。

Jan, 2020

评估可信 AI 医学数据质量的 METRIC 框架：一项系统综述

通过系统评估医学数据集合，我们提出了 METRIC 框架，该框架包含了 15 个数据质量意识维度，帮助减少偏见、增加稳健性、提高可解释性，从而为医学中可信赖的人工智能奠定了基础。

Feb, 2024

医学影像公平性基准测试

该研究介绍了 MEDFAIR 框架，可以用于医学成像机器学习模型的公平性评估和算法的基准测试，通过实验发现模型选择标准可以对公平性结果产生重要影响，并在不同的应用场景和伦理原则下提供了建议。

Oct, 2022

面向医疗人工智能的统一功利伦理框架

通过分析次级调查数据，我们确定了人工智能在医疗领域中的伦理原则，并提出了一个基于功利主义伦理的新的理论框架来设计医疗领域的伦理人工智能。

Sep, 2023

在医疗和其他领域利用人工智能的道德框架

AI 技术的快速发展与伦理维度的深入研究，特别关注于医疗领域，探索透明度、数据管理、人工监督、教育要求以及国际合作等众多方面，呼吁全球统一的 AI 伦理原则和框架，并提出有益的伦理方案以应对新兴挑战。

Aug, 2023

AI 模型 FAIR 原则在加速高能衍射显微技术中的实际应用

介绍了一套实用、简单、可衡量的 FAIR 准则，用于 AI 模型的数据管理和保存；展示了一个领域无关的计算框架，其中包含了 Advanced Photon Source、Materials Data Facility、Data and Learning Hub for Science、funcX 和 Argonne Leadership Computing Facility (ALCF) 等元素，以期在 AI 驱动的自主发现方面发挥作用。

Jul, 2022