TrialBench: 多模态人工智能准备的临床试验数据集
通过深入文献和在线资源的系统性研究,我们编制并发布了一个全面的与临床和生物医学自然语言处理(NLP)广泛领域相关的数据集和基准目录,对 450 个 NLP 数据集进行了手动系统化和注释处理,并与跨医疗应用的相关任务进行了比较,结果显示,当前可用的人工智能基准测试不同于希望在临床环境中进行人工智能自动化的任务,因此需要创建新的基准测试以填补这些差距。
Jan, 2022
本文系统综述了三个主要主题:临床模拟,个体化预测建模和计算机辅助试验设计,重点关注机器学习在这些应用中的应用,讨论了 AI 在实际应用中 in silico 试验的挑战和机遇。
Sep, 2022
该研究提出了利用来自公开可用的激痛医学信息库(MIMIC-III)数据集的四个临床预测基准,旨在解决机器学习在医疗保健研究中缺乏公开可用基准数据集的问题。
Mar, 2017
临床试验结果预测的多模态融合专家模型(LIFTED)通过将各种方式的数据转化为自然语言描述,再利用统一的噪声抵抗编码器提取信息,进一步利用稀疏的专家模型优化表示,通过动态集成不同方式的表示进行预测,有效提升临床试验结果预测性能。
Feb, 2024
机器学习在医疗人工智能系统中的应用,从传统和统计方法转向深度学习模型甚至最近的生成模型。近年来,发现了支持多模态数据集成的广泛可用的深度学习架构,尤其是针对图像的。将多种模态融入到这些模型中是一个蓬勃发展的研究课题,提出了独特的挑战。本文讨论了针对医学基于图像的临床决策支持模型的多模态人工智能的五大挑战(表示、融合、对齐、翻译和协同学习),并调查了近期解决这些挑战的方法。我们最后讨论了该领域的未来,并提出了在成功的临床模型及其在临床环境中的转化方面应进一步阐明的方向。
Nov, 2023
诊断和治疗患者是一个复杂的、顺序的决策过程,医生需要获取信息并进行相应操作。本研究介绍了 AgentClinic,一个用于评估大型语言模型在模拟临床环境中扮演医生角色能力的多模态基准测试。
May, 2024
本综述分析了 40 项使用人工智能模型(主要是机器学习模型)预测 2 型糖尿病(T2DM)风险的研究,结果显示单模态和多模态模型表现良好,但是外部验证和新型生物标志的应用不足。
May, 2023
通过系统评估医学数据集合,我们提出了 METRIC 框架,该框架包含了 15 个数据质量意识维度,帮助减少偏见、增加稳健性、提高可解释性,从而为医学中可信赖的人工智能奠定了基础。
Feb, 2024
开发了一个名为 PyTrial 的 Python 包,实现了支持人工智能算法的各种临床试验任务,包括患者预后预测、试验结果预测、患者 - 试验匹配、试验相似性搜索和合成数据生成。
Jun, 2023
将人工智能(AI)与临床诊断过程中的大型语言模型(LLMs)整合,可以显著提高医疗保健的效率和可访问性。本研究通过引入 CliBench—— 一个基于 MIMIC IV 数据集的新型基准测试,评估 LLMs 在临床诊断中的能力,覆盖了多种临床病例的诊断,并包括与临床有关的任务,如治疗程序识别、实验室检查和药物处方等。通过结构化输出本体,CliBench 能够深入了解 LLMs 在不同临床任务上的能力,从而为 LLM 在医疗保健领域的未来发展提供有价值的见解。
Jun, 2024