May, 2024

跨关怀:预训练数据对语言模型偏见的医疗影响评估

TL;DR介绍了 Cross-Care,这是第一个专门评估 LLMs 中存在的倾向和现实世界知识的基准框架,重点关注不同人群中疾病患病率的表征,并揭示了在预训练文本中嵌入的人口统计偏差如何影响 LLMs 的输出。结果显示,LLMs 对疾病患病率的表征与不同人群实际患病率之间存在重大不一致,存在偏倚传播和缺乏实际世界基础的风险。