使用 MIMIC-IV 进行基准测试:一种不规则、稀疏的临床时间序列数据集
该研究提出了利用来自公开可用的激痛医学信息库(MIMIC-III)数据集的四个临床预测基准,旨在解决机器学习在医疗保健研究中缺乏公开可用基准数据集的问题。
Mar, 2017
本文提出了一个基于 MIMIC-IV 公共电子病历数据集的 ICD 编码公共基准套件,使数据预处理标准化并建立全面的 ICD 编码基准数据集,加速未来研究中采用自动 ICD 编码的进展。
Apr, 2023
本篇论文通过 MIMIC-III 数据集进行临床预测任务(如死亡率预测、住院时间预测以及 ICD-9 编码分组预测)的基准测试,结果表明,相较于基于机器学习模型和预测评分系统,深度学习模型在使用原始临床时间序列数据作为输入特征时有更好的表现。
Oct, 2017
研究使用大型医院拥有的心电图数据库来建模和预测患者死亡率,通过与两种神经网络架构比较四种深度存活建模方法以及在一到十年内的绩效评估,结果表明 AUROC 和协调性得分与以往工作相当(约 0.8),考虑到与死亡率相关的心电图样本的比例(MIMIC-IV:27%,Code-15:4%),AUPRC 得分合理(MIMIC-IV:0.4-0.5,Code-15:0.05-0.13)。
Jun, 2024
为了解决医疗机器学习中数据不一致和标准化处理框架缺失等难题,MIMIC-Extract 提供了一种开源管道,将公开可用的 MIMIC-III 数据库中的复杂健康记录数据转换为可以直接用于通用机器学习管道的数据帧,并展示了其在基准任务和基线结果中的实用性。
Jul, 2019
综合评估医疗机器学习的基准,提出一种基于医学信息志 (MIMIC-III) 的基准,让我们可以直接比较预测性能,并评估生存率、住院时间、表型和患者恶化任务的进展。我们发现,在这些任务上,尽管社区参与度高,但在过去的三年里,几乎没有真正显著的进展。通过我们的元分析,我们发现,深度递归模型的性能仅在某些任务上优于逻辑回归。最后综合这些结果,提出未来医学机器学习基准所需的理想特性。
Oct, 2020
该研究关注深度学习模型在医疗场景下的可解释性和公平性问题,以 MIMIC-IV 数据集为例,分析了预测模型的可解释性和预测公平性,并揭示了该数据集中存在的偏差和不平等对策。
Feb, 2021
我们提出了一种新的文本到 SQL 数据集,用于电子健康记录(EHRs)。该数据集提供了一个挑战,需要模型可以生成反映医院需求范围的 SQL 查询,包括简单检索和复杂操作,如计算生存率,同时需要理解时间表达式以回答与时间敏感相关的问题,并根据预测置信度区分问题是否有答案,以发展和评估结构化 EHR 数据上的 QA 模型并迈向文本到 SQL 研究和医疗保健方面部署之间的缩小差距。
Jan, 2023
使用 MIMIC-IV 数据集研究 XGBoost 二元分类模型在预测 ICU 住院时间方面的公平性和偏见,并强调该研究对 ICU 有限资源分配的重要性,通过在人口属性上检测数据集的类别不平衡,并采用数据预处理和特征提取,发现 XGBoost 模型整体表现良好,但是在种族和保险属性上出现不平等,提出了关于缓解偏见的关注公平机器学习技术的建议,并强调医疗保健专业人员和数据科学家之间的合作努力的必要性。
Dec, 2023
本研究使用 MIMIC-IV 数据库作为数据来源,研究了包括温度、心率、平均血压、呼吸率和 SpO2 等动态的、高频的、多变量的时间序列生命体征数据,并比较了各种聚类算法,选择了一种名为 Time2Feat 的端到端多变量时间序列聚类系统与 K-Means 相结合的方法作为最有效的聚类方法,对 2008 年至 2016 年间入住的 8,080 名患者的数据进行了模型开发和对 2017 年至 2019 年间入住的 2,038 名患者的模型验证。通过分析不同类别之间的临床死亡预后差异,发现不同亚组之间的 ICU 死亡和住院死亡的风险不同。此外,该研究可视化了生命体征变化的轨迹。本研究的结果为多变量时间序列聚类系统在 ICU 中患者管理和监测中的潜在应用提供了有价值的见解。
Jun, 2023