评估机器学习在纵向电子医疗数据上的进展

Oct, 2020

评估机器学习在纵向电子医疗数据上的进展

Evaluating Progress on Machine Learning for Longitudinal Electronic Healthcare Data

David Bellamy, Leo Celi, Andrew L. Beam

TL;DR综合评估医疗机器学习的基准，提出一种基于医学信息志(MIMIC-III)的基准，让我们可以直接比较预测性能，并评估生存率、住院时间、表型和患者恶化任务的进展。我们发现，在这些任务上，尽管社区参与度高，但在过去的三年里，几乎没有真正显著的进展。通过我们的元分析，我们发现，深度递归模型的性能仅在某些任务上优于逻辑回归。最后综合这些结果，提出未来医学机器学习基准所需的理想特性。

Abstract

The Large Scale Visual Recognition Challenge based on the well-known Imagenet dataset catalyzed an intense flurry of progress in computer vision. benchmark tasks have propelled other sub-fields of machine learning forward at an equally impressive pace, but in healthcare it has primaril

发现论文，激发创造

基于纵向实验室检验的多任务疾病发作预测

本研究采用机器学习方法，结合各种测量指标，包括检验实验室检测结果等信息，使用 Long Short-Term Memory 和两种卷积神经网络，基于 298K 患者 8 年行政索赔数据中的 18 种常见实验室检测结果，对 133 种疾病风险进行预测，并通过数据实验结果对比分析表明，疾病预测方面基于深度学习的方法有很好的应用前景。

Aug, 2016

临床时间序列数据的多任务学习和基准测试

该研究提出了利用来自公开可用的激痛医学信息库（MIMIC-III）数据集的四个临床预测基准，旨在解决机器学习在医疗保健研究中缺乏公开可用基准数据集的问题。

Mar, 2017

基于MIMIC大型医疗数据集的深度学习模型对比

本篇论文通过 MIMIC-III 数据集进行临床预测任务（如死亡率预测、住院时间预测以及 ICD-9 编码分组预测）的基准测试，结果表明，相较于基于机器学习模型和预测评分系统，深度学习模型在使用原始临床时间序列数据作为输入特征时有更好的表现。

Oct, 2017

人工智能发展的基准数据集未能满足医疗专业人员的需求

通过深入文献和在线资源的系统性研究，我们编制并发布了一个全面的与临床和生物医学自然语言处理（NLP）广泛领域相关的数据集和基准目录，对450个NLP数据集进行了手动系统化和注释处理，并与跨医疗应用的相关任务进行了比较，结果显示，当前可用的人工智能基准测试不同于希望在临床环境中进行人工智能自动化的任务，因此需要创建新的基准测试以填补这些差距。

Jan, 2022

BenchMD：面向医学影像和传感器的模态不可知学习基准测试

提出了一个名为BenchMD的基准测试平台，旨在评估面向临床任务的多个医疗模态数据上的通用AI算法如何处理，包括使用modality-agnostic方法和self-supervised learning技术，研究结果表明当前没有一种方法可以在所有模态上实现出色性能。

Apr, 2023

EHRSHOT: 用于基础模型少样本评估的电子病历基准

通过发布一份新的、包含6712位患者电子病历数据的纵向数据集EHRSHOT、以及一个141M参数的、预训练于257万位患者结构化病历数据的临床基础模型权重，在为医疗机器学习提供共享资产方面，该研究作出了贡献。

Jul, 2023

半监督和自监督学习在医学图像上的准确率与时间前沿

对医学图像分类应用进行的研究表明，使用未标记的数据可以提高分类器的性能，通过自监督学习和半监督学习的方法，本研究在医学图像领域设计了一个基准测试，发现MixMatch、SimCLR和BYOL方法是强有力的选择，并提供适用于新医学任务的设置以及进一步搜索的方法。

Jul, 2023

数据有效学习：一项综合医学基准

我们的研究论文针对数据有效学习在医学领域的研究空白，引入了一种全面的基准，用于评估医学领域中的数据有效学习。该基准包括来自31个医疗中心的数百万数据样本的数据集（DataDEL），用于对比的基线方法（MedDEL），以及客观衡量数据有效学习性能的新评估指标（NormDEL）。我们广泛的实验结果表明，基线方法MedDEL仅使用5%的数据就可以达到与原始大数据集相当的性能。建立这样一个开放的数据有效学习基准对医学人工智能研究社区至关重要，因为它促进了高效数据利用、推动协作突破和发展成本效益高、可扩展且有影响力的医疗解决方案。

Jan, 2024

重新思考模型原型设计：通过MedMNIST+数据集集合

该研究提供了一个全面的基准测试，用于多样化评估医学图像分类的常见卷积神经网络和Transformer-based模型，并发现计算效率高的训练方案和现代基础模型在减少昂贵的端到端训练和资源精细的方法之间具有潜力。此外，研究结果表明，较高分辨率未必在一定阈值之上始终提高性能，提倡在原型阶段尤其使用较低分辨率以加快处理速度。同时，该研究也确认了卷积模型与ViT-based模型的竞争力，强调了不同模型架构的内在能力的重要性。希望该研究的标准化评估框架能够提高MedMNIST+数据集以及未来研究的透明度、可复现性和可比性。

Apr, 2024

医疗预后中的机器学习应用：全面综述

本研究针对医疗预后的现有问题，通过系统回顾各种机器学习技术的应用，指出了这些方法的有效性、挑战及未来方向。论文展示了随机森林、逻辑回归、卷积神经网络和长短期记忆网络等技术在疾病预测和风险评估中的关键优势，强调了模型解释性的重要性及数据质量的挑战，为提高患者预后提供了潜在影响。

Aug, 2024