评估机器学习在纵向电子医疗数据上的进展
本研究采用机器学习方法,结合各种测量指标,包括检验实验室检测结果等信息,使用 Long Short-Term Memory 和两种卷积神经网络,基于 298K 患者 8 年行政索赔数据中的 18 种常见实验室检测结果,对 133 种疾病风险进行预测,并通过数据实验结果对比分析表明,疾病预测方面基于深度学习的方法有很好的应用前景。
Aug, 2016
该研究提出了利用来自公开可用的激痛医学信息库(MIMIC-III)数据集的四个临床预测基准,旨在解决机器学习在医疗保健研究中缺乏公开可用基准数据集的问题。
Mar, 2017
本篇论文通过 MIMIC-III 数据集进行临床预测任务(如死亡率预测、住院时间预测以及 ICD-9 编码分组预测)的基准测试,结果表明,相较于基于机器学习模型和预测评分系统,深度学习模型在使用原始临床时间序列数据作为输入特征时有更好的表现。
Oct, 2017
通过深入文献和在线资源的系统性研究,我们编制并发布了一个全面的与临床和生物医学自然语言处理(NLP)广泛领域相关的数据集和基准目录,对450个NLP数据集进行了手动系统化和注释处理,并与跨医疗应用的相关任务进行了比较,结果显示,当前可用的人工智能基准测试不同于希望在临床环境中进行人工智能自动化的任务,因此需要创建新的基准测试以填补这些差距。
Jan, 2022
提出了一个名为BenchMD的基准测试平台,旨在评估面向临床任务的多个医疗模态数据上的通用AI算法如何处理,包括使用modality-agnostic方法和self-supervised learning技术,研究结果表明当前没有一种方法可以在所有模态上实现出色性能。
Apr, 2023
通过发布一份新的、包含6712位患者电子病历数据的纵向数据集EHRSHOT、以及一个141M参数的、预训练于257万位患者结构化病历数据的临床基础模型权重,在为医疗机器学习提供共享资产方面,该研究作出了贡献。
Jul, 2023
对医学图像分类应用进行的研究表明,使用未标记的数据可以提高分类器的性能,通过自监督学习和半监督学习的方法,本研究在医学图像领域设计了一个基准测试,发现MixMatch、SimCLR和BYOL方法是强有力的选择,并提供适用于新医学任务的设置以及进一步搜索的方法。
Jul, 2023
我们的研究论文针对数据有效学习在医学领域的研究空白,引入了一种全面的基准,用于评估医学领域中的数据有效学习。该基准包括来自31个医疗中心的数百万数据样本的数据集(DataDEL),用于对比的基线方法(MedDEL),以及客观衡量数据有效学习性能的新评估指标(NormDEL)。我们广泛的实验结果表明,基线方法MedDEL仅使用5%的数据就可以达到与原始大数据集相当的性能。建立这样一个开放的数据有效学习基准对医学人工智能研究社区至关重要,因为它促进了高效数据利用、推动协作突破和发展成本效益高、可扩展且有影响力的医疗解决方案。
Jan, 2024
该研究提供了一个全面的基准测试,用于多样化评估医学图像分类的常见卷积神经网络和Transformer-based模型,并发现计算效率高的训练方案和现代基础模型在减少昂贵的端到端训练和资源精细的方法之间具有潜力。此外,研究结果表明,较高分辨率未必在一定阈值之上始终提高性能,提倡在原型阶段尤其使用较低分辨率以加快处理速度。同时,该研究也确认了卷积模型与ViT-based模型的竞争力,强调了不同模型架构的内在能力的重要性。希望该研究的标准化评估框架能够提高MedMNIST+数据集以及未来研究的透明度、可复现性和可比性。
Apr, 2024
本研究针对医疗预后的现有问题,通过系统回顾各种机器学习技术的应用,指出了这些方法的有效性、挑战及未来方向。论文展示了随机森林、逻辑回归、卷积神经网络和长短期记忆网络等技术在疾病预测和风险评估中的关键优势,强调了模型解释性的重要性及数据质量的挑战,为提高患者预后提供了潜在影响。
Aug, 2024