May, 2024
AgentClinic:评估 AI 在模拟临床环境中的多模态代理基准
AgentClinic: a multimodal agent benchmark to evaluate AI in simulated clinical environments
Samuel Schmidgall, Rojin Ziaei, Carl Harris, Eduardo Reis, Jeffrey Jopling...
TL;DR诊断和治疗患者是一个复杂的、顺序的决策过程,医生需要获取信息并进行相应操作。本研究介绍了 AgentClinic,一个用于评估大型语言模型在模拟临床环境中扮演医生角色能力的多模态基准测试。