- ACL使用人口普查数据测量语言模型中的规范性和描述性偏见
本文研究了在预训练语言模型中,关于职业性别分布如何反映在模型中,通过使用模板化句子结合特定职业性别分布数据,通过评估不同语言的模型得出结论。
- 大型预训练神经语言模型中的潜在情感偏差:黑人与愤怒,白人与喜悦?
该研究针对大型预训练语言模型,通过对其在情感检测任务中存在的偏向性进行调查,揭示了情感偏差的存在。在分析情感偏斜的语料库分布的基础上,研究对不同偏向进行了广泛的分类和强度评估, 结果表明大型预训练语言模型在情感检测系统中存在明显的情感偏差, - 词嵌入中性别偏见对抑郁症预测的影响
本研究分析了针对心理障碍领域中抑郁症类别的四种不同预训练词嵌入在性别方面的偏见。研究发现,不同类型的词嵌入在抑郁症方面存在不同的性别偏见,通过简单地交换性别词语进行数据增强可以显著减轻这种偏见。
- 使用开放式应激反应预测不同人群间的抑郁症状
本研究调查了各性别和种族 / 民族组之间有关压力源的开放式文本反应和抑郁症状的关系,并使用主题模型和其他 NLP 工具发现了不同人口群体报告压力源时的主题和词汇差异,并使用自报压力源训练语言模型来预测抑郁症状,发现压力源和抑郁症状之间存在关 - EMNLP文本到图像生成模型能多好地理解伦理自然语言干预?
通过在输入提示中添加伦理干预来支持公平判断,我们研究了文本描述生成模型在生成图像时对特定社会群体的偏好,并使用 ENTIGEN 数据集评估伦理干预对图像生成的影响。我们发现,使用 ENTIGEN 框架生成的图像涵盖了不同的社会群体,并在保持 - 野外人脸软生物特征:最新研究,注释和 COTS 评估
本研究探讨软生物特征在不受限场景下增强人脸识别系统的作用,并使用 LFW 数据集展示了软生物特征与深度学习人脸检测系统融合后能够相对提高 40%/15%的验证性能。
- 用户感知的阿拉伯语性别重写器
介绍了 User-Aware Arabic Gender Rewriter,一个基于用户的阿拉伯语性别重写对于两个用户的上下文环境的 Web 系统。该系统可以接受阿拉伯语或英语句子作为输入,并为用户提供指定所需的第一和 / 或第二人称目标性 - ACL偏见的诞生:一项关于英语语言模型中性别偏见演变的研究
研究发现使用 LSTM 架构训练的语言模型在表示性别时存在动态变化,并且性别信息逐渐局部化。通过监控训练动态,可以检测到女性和男性在输入嵌入中的表示不对称。去除偏见的策略如何应用需要更多深入探讨。
- GBDF: 面向公平 DeepFake 检测的性别平衡 DeepFake 数据集
本文建立了一个性别平衡且标注了性别标签的深度伪造数据集,用于解决当前深度学习伪造检测器在性别上表现差异导致的不公平问题。分析结果表明,当前普遍采用的深度伪造检测器在大多数情况下男性的表现优于女性的表现。
- 移情对话:上下文对话的多层数据集
本研究建立了感同身受情感对话数据集,收集了受访者的特征、新闻文章引发的自我报告的同理心反应、对谈伙伴的他人报告,以及对话中表达的自我披露、情感和同理心等信息,旨在探讨不同形式的同理心与其他情感现象及人口统计学因素之间的关系,提供了预测这些特 - 视觉语义人工智能中的标记性
通过评估 CLIP 模型的性别、种族和年龄标记偏见,我们发现 CLIP 在白人个体上更容易选择人这个标签而不是种族或者性别标记,同时在男性个体上更倾向于性别标记而非年龄标记,表明其训练数据存在语言和社会偏见。
- 一种从 Reddit 理解心理健康的计算方法:基于知识的多任务学习框架
本文设计并评估了一种捕捉在社交媒体上关于 CVD 相关的心理健康症状如何不同地表达男女之间的方法,并采用 GeM,一种任务自适应的多任务学习方法来区分不同性别的语言中的心理健康症状,GeM 模型相比于当前最先进的语言模型,能更好地识别和预测 - 媒体人格化政治中的性别刻板印象:基于词汇、句法和情感分析的实证研究
通过语言、句法和情感分析的方法,本文研究了 2017-2020 年意大利政治官员个人化方面的性别角色问题,并提出了一种计算词汇得分的方法,结果表明政治个人化更加损害女性。女性政治家受到比男性政治家更多的负面言论报道,相信这与某些刻板印象的存 - AAAI面部分析中的偏差解剖
本文提出了用于面部分析的偏差检测 / 估计和减轻算法,并对已提出的偏差检测算法进行了系统综述。其主要贡献是对现有的偏差缓解算法进行了分类和广泛的概述。我们还讨论了偏差面部分析领域中的开放挑战。
- EMNLP利用社会语言学变量揭示性取向和性别态度的变化
本文研究了在美国社会语言学的词汇选择中关于同性恋和性别的态度变化,通过在 Twitter 和 Reddit 上对 8700 万条消息的纵向分析,发现态度正在发生变化但是这些变化是由特定人口群体驱动的,并且在溯因分析中表明不同州的婚姻平等法案 - 语言技术中性别排他性的危害及非二元表述中的挑战
本文对非二元性别在语言任务中的表现、二元看待性别的伤害、语言技术中现有偏见以及如何公平地编码性别信息进行了探讨。
- ICCV揭示图像扭曲对预训练人脸识别模型预测偏差的影响
本文旨在探讨预训练模型在输入图像扭曲时是否会出现偏向性。通过对四个深度人脸识别模型在图像扭曲下不同性别和种族子群的表现进行系统分析,我们发现图像扭曲与模型在不同子群之间的性能差距存在关联。
- ACL双倍劣势:预训练视觉与语言模型中的偏见复合
该研究扩展了文本偏差分析方法,以调查多模式语言模型,并分析了这些模型学习的内部和跨模态关联和偏见。具体而言,该研究表明 VL-BERT 展示出性别偏见,往往更喜欢强化刻板印象而不是忠实描述视觉场景。
- WWW算法交付求职广告的歧视审计
本文提出了一种黑盒审核算法检测招聘广告投放中的歧视现象的新方法,通过对两个公司的类似工作广告的同时投放来控制工作资质的差异,验证了 Facebook 招聘广告投放的性别偏差,证明了该现象不能通过资质差异来解释,而 LinkedIn 广告投放 - 基于轻量级神经网络的多任务学习的面部表情和属性识别
本研究探讨轻量级卷积神经网络的多任务学习,用于识别人脸和分类面部属性(年龄,性别,种族),并在没有距离边缘的剪裁人脸上进行训练,需要微调这些网络以预测面部表情;使用 MobileNet、EfficientNet 和 RexNet 架构提出了