Mar, 2024

使用具有状态感知病人模拟器的自动交互式评估大型语言模型

TL;DR通过引入自动交互评估(AIE)框架和状态感知患者模拟器(SAPS),本文介绍了一种增强大型语言模型(LLMs)在医疗保健领域应用的方法,通过多轮医患模拟来评估 LLMs 的性能,从而更好地满足临床实践的需求。实验证明了 AIE 框架的有效性,并与人类评估结果一致,强调其改进医疗保健交付的潜力。