BriefGPT.xyz
Ask
alpha
关键词
extrinsic metrics
搜索结果 - 2
选择你的视角:性别偏见评估中的缺陷
通过评估当前性别偏见评估范式并识别其中的一些缺陷,我们提出了一些更可靠的性别偏见评估指南,强调了衡量模型性别影响的外在偏差度量的重要性,并发现数据集和度量往往是相互耦合的,这是导致获取可靠结论能力受到阻碍的原因之一。
PDF
2 years ago
关于上下文语言表示的内在公正性和外在公正性评估指标
本文对 19 个语境化语言模型进行了广泛的相关性研究,并发现即使在校正度量不准确、评估数据集中有噪声以及实验配置方式等混淆因素的情况下,内在度量和外在度量不一定在其原始设置中相关。
PDF
2 years ago
Prev
Next