Apr, 2024

CLUE: 用于 LLMs 的临床语言理解评估

TL;DR为填补现有研究中缺乏对医疗领域广泛应用的临床任务的评估的空白,我们提出了一种适用于现实世界临床任务的基准测试工具 CLUE,并通过评估多个生物医学和通用领域 LLMs 的临床表现和适用性,推进医疗领域的 LLMs 评估和开发的标准化方法。