May, 2024

AgentClinic:评估 AI 在模拟临床环境中的多模态代理基准

TL;DR诊断和治疗患者是一个复杂的、顺序的决策过程,医生需要获取信息并进行相应操作。本研究介绍了 AgentClinic,一个用于评估大型语言模型在模拟临床环境中扮演医生角色能力的多模态基准测试。