临床机器学习中的有效性问题：间接数据标注使用共识定义

Nov, 2023

临床机器学习中的有效性问题：间接数据标注使用共识定义

Validity problems in clinical machine learning by indirect data labeling using consensus definitions

Michael Hagmann, Shigehiko Schamoni, Stefan Riezler

TL;DR机器学习在医学疾病诊断这一关键应用领域存在一个有效性问题，当训练数据中的目标标签通过间接测量确定时，若基础测量数据包括在输入数据表示中，则机器学习模型只会学会复原已知目标定义，导致模型在与其类似的测试数据上表现完美，但在现实世界中，当定义的基础测量无法完全获取时，模型将在可接近灾难的程度上失败。我们提出了一个通用的流程用于识别存在问题的数据集和黑盒机器学习模型，并将我们的检测流程应用于败血症早期预测任务。

Abstract

We demonstrate a validity problem of machine learning in the vital application area of disease diagnosis in medicine. It arises when targe

machine learning disease diagnosis validity problem indirect measurement early prediction

发现论文，激发创造

利用标签间的依赖关系从头开始学习诊断

使用 LSTM 从胸部 X 光片中预测 14 种病理模式，提出并讨论了与临床实践相关的替代评估指标，其结果在 NIH 提供的最大公开胸部 X 光数据集上获得了最新的技术成果。

Oct, 2017

机器学习诱发的脓毒症过度诊断的量化研究

通过集成预测模型标签与簇医学轨迹的方法，本研究开发了一种创新的方法，可以在模型开发期间预测性的检测到潜在的过度诊断病例，以提供安全的计算机诊断工具使用指南。

Jul, 2021

使用主动学习量化本地模型的有效性

通过主动学习减少所需数据量并学习模型错误来获得本地有效性估计，而不是全局指标太不敏感或评估本地有效性成本过高。使用模型验证基准，提供实证证据表明该方法能够在使用相对较少的数据量时生成具有足够辨别性能的错误模型，同时相比于替代方法，对于本地有效性边界的局部变化具有增强的敏感性。

Jun, 2024

测试集中普遍出现标签错误，破坏机器学习基准

利用自信学习算法和众包验证方法发现了 10 个常用计算机视觉、自然语言和音频数据集的测试集中的标签错误问题，并探讨了这些标签错误对基准结果的影响以及建议应该使用经过正确标注的测试集来评估模型的有效性，对于高比例的标记错误的现实世界数据集，低容量的模型可能比高容量的模型更实用。

Mar, 2021

重新思考病理学中机器学习模型的评估

该论文提出了一套实用的机器学习评估指南，旨在应对病理图像应用中存在的各种问题，包括标签变异性、领域偏移、鲁棒性和混淆变量等，以进一步改善患者结果。

Apr, 2022

面向诊所可信人工智能的情境依赖性可解释性与可争辩性：早产儿患病识别模型中的误分辨识别

该研究通过解释 AI 推荐来支持临床医生识别 ML 模型训练中的失误，并提出了一种基于临床背景潜在空间、全局解释和基于潜在空间相似性的本地解释的方法来支持医生鉴定基于表格数据的 ML 模型的失误，在早产儿并发症的风险评估中取得了成功应用，并提供临床实用的支持建议。

Dec, 2022

监控机器学习模型：在线检测相关偏差

该研究提出了一种序列监测方案，通过考虑测量模型质量的时间依赖性，减少不必要的警报并解决多重测试问题，从而在检测模型质量相关变化方面优于基准方法。此研究为在动态环境中区分小幅波动和有意义的模型性能退化提供了实用解决方案，确保机器学习模型的可靠性。

Sep, 2023

专家一致性存在下的有选择标签学习

本论文探讨选择性标签下算法辅助决策学习的问题，介绍为什么标准方法无法有效处理选择性标签的普遍选择偏误问题，提出了一种数据增强方法，既可以利用专家一致性减轻选择性标签导致的部分盲目性，也可以经验验证学习是否会导致易受系统性歧视的不可靠模型。

Jul, 2018

开放式医学诊断

本篇研究使用机器学习的方式对医学领域的诊断结果进行预测，并将其作为开放式学习问题进行研究，并探讨了将训练数据分布在多个医疗保健站点的情况下，构建开放式诊断集合的不同策略.

Oct, 2019

人类标注变异的 ' 问题 '：关于数据、建模和评估中的基础真相

本文探讨人类标注变异的问题在机器学习中的影响及解决方法，并提供一个包含无聚合标签的公开数据集库以便以后进行研究。

Nov, 2022