Mar, 2024
使用具有状态感知病人模拟器的自动交互式评估大型语言模型
Automatic Interactive Evaluation for Large Language Models with State
Aware Patient Simulator
TL;DR通过引入自动交互评估(AIE)框架和状态感知患者模拟器(SAPS),本文介绍了一种增强大型语言模型(LLMs)在医疗保健领域应用的方法,通过多轮医患模拟来评估LLMs的性能,从而更好地满足临床实践的需求。实验证明了AIE框架的有效性,并与人类评估结果一致,强调其改进医疗保健交付的潜力。