Mar, 2024

调查机器翻译中性别偏见的标记和驱动因素

TL;DR通过反向翻译方法研究大型语言模型中的内隐性别偏见,比较不同语言的结果,提出一种新的评估性别隐含变化的度量标准,并探究驱动偏见的句子特征,结果表明该方法能够进一步揭示语言模型中的偏见。