Mar, 2024
使用具有状态感知病人模拟器的自动交互式评估大型语言模型
Automatic Interactive Evaluation for Large Language Models with State Aware Patient Simulator
Yusheng Liao, Yutong Meng, Yuhao Wang, Hongcheng Liu, Yanfeng Wang...
TL;DR通过引入自动交互评估(AIE)框架和状态感知患者模拟器(SAPS),本文介绍了一种增强大型语言模型(LLMs)在医疗保健领域应用的方法,通过多轮医患模拟来评估 LLMs 的性能,从而更好地满足临床实践的需求。实验证明了 AIE 框架的有效性,并与人类评估结果一致,强调其改进医疗保健交付的潜力。