May, 2024

跨关怀: 预训练数据对语言模型偏见的医疗影响评估

TL;DR介绍了Cross-Care,这是第一个专门评估LLMs中存在的倾向和现实世界知识的基准框架,重点关注不同人群中疾病患病率的表征,并揭示了在预训练文本中嵌入的人口统计偏差如何影响LLMs的输出。结果显示,LLMs对疾病患病率的表征与不同人群实际患病率之间存在重大不一致,存在偏倚传播和缺乏实际世界基础的风险。