Aug, 2023

LLM-Mini-CEX: 大型语言模型的自动评估用于诊断对话

TL;DR为了提高诊断效率,增强医疗诊断的技术潜力,我们建立了一种评估标准 (LLM-specific Mini-CEX),通过自动对话评估与 ChatGPT 的交互并替代人工评估,可以有效评估医疗诊断对话和比较不同 LLMs 之间的质量。