Oct, 2022

使用模板量化社会偏见是不可靠的

TL;DR研究证明,使用样板评估来量化社会偏见可能不可靠,本文研究了在不破坏语义的情况下手动修改先前工作中使用的模板是否会影响偏见测量的结果,结果显示在四项任务中,模板的修改会使偏见值和相应的结论在不同程度上变化,有增有减,因此,对于 LLMs 的公平性评估需要更加谨慎。