TrialBench: 多模态人工智能准备的临床试验数据集

Jun, 2024

TrialBench: 多模态人工智能准备的临床试验数据集

TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets

Jintai Chen, Yaojun Hu, Yue Wang, Yingzhou Lu, Xu Cao...

TL;DR通过提供 AI-ready 多模式数据集和 8 个重要的临床试验设计预测挑战，本研究解决了医疗数据收集和试验设计对人工智能应用的障碍，以促进临床试验研究与医疗解决方案的发展。

Abstract

clinical trials are pivotal for developing new medical treatments, yet they typically pose some risks such as patient mortality, adverse events, and enrollment failure that waste immense efforts spanning over a decade. Applying →

clinical trials artificial intelligence datasets prediction challenges trial designs

发现论文，激发创造

人工智能发展的基准数据集未能满足医疗专业人员的需求

通过深入文献和在线资源的系统性研究，我们编制并发布了一个全面的与临床和生物医学自然语言处理（NLP）广泛领域相关的数据集和基准目录，对 450 个 NLP 数据集进行了手动系统化和注释处理，并与跨医疗应用的相关任务进行了比较，结果显示，当前可用的人工智能基准测试不同于希望在临床环境中进行人工智能自动化的任务，因此需要创建新的基准测试以填补这些差距。

Jan, 2022

基于人工智能的体外临床试验：综述

本文系统综述了三个主要主题：临床模拟，个体化预测建模和计算机辅助试验设计，重点关注机器学习在这些应用中的应用，讨论了 AI 在实际应用中 in silico 试验的挑战和机遇。

Sep, 2022

临床时间序列数据的多任务学习和基准测试

该研究提出了利用来自公开可用的激痛医学信息库（MIMIC-III）数据集的四个临床预测基准，旨在解决机器学习在医疗保健研究中缺乏公开可用基准数据集的问题。

Mar, 2017

基于大型语言模型的多模态临床试验结果预测

临床试验结果预测的多模态融合专家模型（LIFTED）通过将各种方式的数据转化为自然语言描述，再利用统一的噪声抵抗编码器提取信息，进一步利用稀疏的专家模型优化表示，通过动态集成不同方式的表示进行预测，有效提升临床试验结果预测性能。

Feb, 2024

面向临床辅助基于成像的生物医学应用的多模态机器学习

机器学习在医疗人工智能系统中的应用，从传统和统计方法转向深度学习模型甚至最近的生成模型。近年来，发现了支持多模态数据集成的广泛可用的深度学习架构，尤其是针对图像的。将多种模态融入到这些模型中是一个蓬勃发展的研究课题，提出了独特的挑战。本文讨论了针对医学基于图像的临床决策支持模型的多模态人工智能的五大挑战（表示、融合、对齐、翻译和协同学习），并调查了近期解决这些挑战的方法。我们最后讨论了该领域的未来，并提出了在成功的临床模型及其在临床环境中的转化方面应进一步阐明的方向。

Nov, 2023

AgentClinic：评估 AI 在模拟临床环境中的多模态代理基准

诊断和治疗患者是一个复杂的、顺序的决策过程，医生需要获取信息并进行相应操作。本研究介绍了 AgentClinic，一个用于评估大型语言模型在模拟临床环境中扮演医生角色能力的多模态基准测试。

May, 2024

基于人工智能的精准医学方法：糖尿病风险预测

本综述分析了 40 项使用人工智能模型（主要是机器学习模型）预测 2 型糖尿病（T2DM）风险的研究，结果显示单模态和多模态模型表现良好，但是外部验证和新型生物标志的应用不足。

May, 2023

评估可信 AI 医学数据质量的 METRIC 框架：一项系统综述

通过系统评估医学数据集合，我们提出了 METRIC 框架，该框架包含了 15 个数据质量意识维度，帮助减少偏见、增加稳健性、提高可解释性，从而为医学中可信赖的人工智能奠定了基础。

Feb, 2024

PyTrial: 人工智能药物研发综合平台

开发了一个名为 PyTrial 的 Python 包，实现了支持人工智能算法的各种临床试验任务，包括患者预后预测、试验结果预测、患者 - 试验匹配、试验相似性搜索和合成数据生成。

Jun, 2023

CliBench: 临床决策中大型语言模型在诊断、过程、实验室测试和处方方面的多方面评估

将人工智能（AI）与临床诊断过程中的大型语言模型（LLMs）整合，可以显著提高医疗保健的效率和可访问性。本研究通过引入 CliBench—— 一个基于 MIMIC IV 数据集的新型基准测试，评估 LLMs 在临床诊断中的能力，覆盖了多种临床病例的诊断，并包括与临床有关的任务，如治疗程序识别、实验室检查和药物处方等。通过结构化输出本体，CliBench 能够深入了解 LLMs 在不同临床任务上的能力，从而为 LLM 在医疗保健领域的未来发展提供有价值的见解。

Jun, 2024