Finspector：基于人的视角的视觉检查工具，用于探索和比较基础模型中的偏差

May, 2023

Finspector：基于人的视角的视觉检查工具，用于探索和比较基础模型中的偏差

Finspector: A Human-Centered Visual Inspection Tool for Exploring and Comparing Biases among Foundation Models

Bum Chul Kwon, Nandana Mihindukulasooriya

TL;DR该研究提出了Finspector, 一种基于视觉分析的人性化文本偏差检测工具，通过语言模型生成的对数似然得分来检测不同类别中的偏差，旨在促进公正使用这些模型的部署

Abstract

Pre-trained transformer-based language models are becoming increasingly popular due to their exceptional performance on various benchmarks. However, concerns persist regarding the presence of hidden biases within

发现论文，激发创造

ELEVATER: 一种用于评估语言增强视觉模型的基准和工具包

本研究发展了 ELEVATER，作为第一个用于评估（预训练）语言增强视觉模型的基准和工具包，包括数据集、工具包和度量标准。ELEVATER是计算机视觉中的一个平台，并已公开发布。

Apr, 2022

关注偏差：针对上下文语言模型的偏差检测方法的关键回顾

本文为了解决公开领域语言模型中偏见检测的问题，就语境化语言模型偏见检测方法和静态单词嵌入偏见检测方法进行了严谨的分析和比较，发现了实现上的一些决策或错误对检测结果可能产生显著的影响，并提出了未来偏见检测方法更好、更健壮、更一致的方向。

Nov, 2022

FairPy：一个大型语言模型的社会偏见评估与缓解工具包

本文全面评估了常用的预训练语言模型（如BERT、GPT-2等）在种族、性别、种族、年龄等方面所表现出的各种偏见，并介绍了一种工具包，提供了插入数学工具程序以识别偏见的接口，并让用户使用这些度量来测试现有的和自定义的模型。此工具还具有消除偏见的功能。

Feb, 2023

自动评估指标中的性别偏见：以图像字幕为例的案例研究

本论文通过系统的调研，研究发现了预训练模型存在性别偏见的问题，探讨了预训练模型在图像字幕生成任务中的公平性影响，并提出了一种针对这种问题的解决方案：结合n-gram匹配和预训练模型评估度量，以减少性别偏见的影响。

May, 2023

VisoGender: 用于衡量图像-文本代词解析性别偏见的数据集

本研究介绍了VisoGender，这是一个用于基准测试视觉语言模型的性别偏见的新数据集。我们专注于与职业相关的性别偏见，并强调每个图像都与包含场景中主体和对象的代词关系的标题相关联。

Jun, 2023

Transformer-Based 语言模型注意力头中的偏见分析

通过对注意力头的偏见分析框架，发现预训练语言模型中存在有偏头部，这有助于对模型公正性进行评估和指导有效减轻策略的开发。对BERT模型和GPT模型的性别和种族偏见进行了广泛的实验研究，进一步理解了预训练语言模型中的偏见行为。

Nov, 2023

公正对待：通过成对扰动对语言模型中的偏见进行稳健评估

FairPair是一个评估框架，用于评估在普通使用中发生的差异对待；通过对具有相同人口群体背景的对照组进行分析，考虑了生成过程本身的变异性，表明更倾向于将家庭和爱好与女性相关联。

Apr, 2024

VLBiasBench：大型视觉语言模型偏见评估综合基准测评

通过引入VLBiasBench数据集和进行广泛的评估，我们对大型视觉语言模型中的偏见进行了全面研究，并揭示了一些新的见解。

Jun, 2024

ViG-Bias: 视觉基础偏见发现与缓解

通过整合视觉解释力量，本研究提出了一个名为Visually Grounded Bias Discovery and Mitigation (ViG-Bias)的简单而高效的技术，并通过全面评估证明其对现有的DOMINO、FACTS和Bias-to-Text等技术的性能提升，在包括CelebA、Waterbirds和NICO++在内的多个具有挑战性的数据集上都取得了成功。

Jul, 2024

偏差检测框架：欧洲语言中的词嵌入和语言模型中的偏差检测

本研究解决了在语言模型和词嵌入中识别社会偏差的具体问题，特别关注欧洲语言的语言和地理特性。论文提出了一种新颖的偏差检测框架，旨在不断更新和扩展其方法，以应对人工智能在劳动市场中的多样性偏见。研究的主要发现是，该框架能有效识别和缓解相关偏差，从而促进更公平的人工智能应用。

Jul, 2024