May, 2024

种子偏见:在线资料中种族和性别对疾病的大规模文本分析

TL;DR本研究旨在分析大规模文本数据中种族和性别词汇与疾病概念的关联,并发现了大型语言模型中存在的偏见以及种族和性别词汇的广泛差异关联,尤其是黑人种族的过度代表现象。研究结果意味着需要在健康等敏感领域中对 LLMs 的训练数据进行关键检查和透明报告,并提出了发展缓解偏见影响的策略的必要性。