Sep, 2024

多样性医学问答:使用大型语言模型评估医疗诊断中的人口统计学偏差

TL;DR本研究解决了大型语言模型在医疗诊断中可能存在的人口统计学偏差问题。我们提出了一种新颖的基准DiversityMedQA,通过对医学考试问题进行扰动,评估不同患者群体中模型回答的差异性。研究发现,模型在不同人口统计条件下的表现存在显著差异,为评估和减少医疗诊断中的人口偏差提供了资源。