Sep, 2024
MedHalu:大型语言模型对医疗查询的幻觉反应
MedHalu: Hallucinations in Responses to Healthcare Queries by Large
Language Models
TL;DR本研究针对大型语言模型(LLMs)在医疗相关查询中产生的幻觉现象进行首次深入探索,识别了LLMs在处理健康问题时生成的不真实信息。我们提出了MedHalu,一个创新的医疗幻觉数据集,并引入MedHaluDetect框架评估LLMs检测幻觉的能力,结果表明LLMs在该方面明显不如医学专家。通过引入专家智慧来提升幻觉检测的效果,我们的研究为提高医疗应用领域LLMs的可靠性提供了重要见解。