BriefGPT.xyz
Ask
alpha
关键词
harmful biases
搜索结果 - 4
大型语言模型的偏见源于其规模
通过探索大型语言模型 (LLMs) 的设计,本文主要讨论偏见与 LLMs 之间的关系,并试图让读者相信有害偏见是目前 LLMs 设计不可避免的结果,因此要解决有害偏见问题,需要对以 LLMs 为驱动的人工智能进行严肃的重新考虑,回到其设计所
→
PDF
17 days ago
TIBET: 文本到图像生成模型中的偏见识别和评估
我们提出了一种通用方法,通过反事实推理来研究和量化任何文本到图像生成模型和任何提示的广泛偏见和偏差,并以语义概念的形式扩展了定量评分。
PDF
7 months ago
使用反事实例探究和减轻视觉 - 语言模型中的交叉社会偏见
使用文本到图像扩散模型在规模上生成对抗实例,以探测和缓解视觉 - 语言模型中的交叉社会偏见。
PDF
7 months ago
利用扩散扰动衡量计算机视觉中的公平性
通过扩散模型生成多个包含不同种族标签的职业图像集,我们发现使用非高加索标签生成的图像的职业错误分类率显著高于使用高加索标签生成的图像,且部分错误分类表明存在种族偏见。通过计算对不同身份群体预测的真实职业标签的概率标准差,我们测量了模型的公平
→
PDF
7 months ago
Prev
Next