May, 2023

构建面向掩蔽语言模型社会偏见的整体度量

TL;DR本文利用高斯分布提出了 KLDivS 和 JSDivS 两种新的评估社会偏见的度量方法,并在公共数据集 StereoSet 和 CrowS-Pairs 上进行了实验,结果表明 KLDivS 和 JSDivS 比过去提出的度量方法更稳定和可解释。