Oct, 2023

GPT模型中存在对穆斯林暴力的偏见

TL;DRGPT-3存在针对穆斯林的暴力生成倾向和反穆斯林偏见,复制实验表明去偏置措施在新模型中不再有效,加强高级关联的去偏置需求。