BriefGPT.xyz
Ask
alpha
关键词
fairness auditing
搜索结果 - 4
公平信念评估 —— 评估语言模型中的有害信念
通过 FairBelief 分析方法,我们揭示了英语语言模型普遍具有关于特定性别的伤害性信念,不同的训练过程、数据集、模型规模和架构会引发各种程度的伤害性信念。
PDF
4 months ago
FairCompass:机器学习中的公平操作
提出了一种名为 'FairCompass' 的人在循环中的公平审计方法,通过混合可视化分析系统将子组发现技术和基于决策树的模式集成到终端用户中,以促进可视分析的知识生成模型的使用,在实际情境中评估了 FairCompass 的公平审计效果,
→
PDF
6 months ago
通过赌博审计公平性
本文提出了一种使用非参数方法、连续监控、基于概率策略和适应分布变化等特征的公平性审计方法,并在多个基准公平性数据集上验证其有效性。
PDF
a year ago
公平性审计的统计推断
通过多重假设检验,在统计保证的前提下,使用自助法在子人群的集合中同时限制性能差异,从而识别受模型性能不足影响的子人群并验证模型在某些子人群中的适用性。此外,该方法还兼容超丰富甚至无限的子人群集合,并支持评估在某些分布变化下的性能。
PDF
a year ago
Prev
Next