stereotypes | BriefGPT - AI 论文速递

关键词stereotypes

搜索结果 - 39

仇恨言论如何因目标身份而异：计算分析
本文研究仇恨言论如何根据目标身份在系统性方面变化。我们发现，针对特定身份群体的仇恨言论分类器很难推广到其他目标身份，而且发现与特定身份有关的仇恨言论中的单词通常涉及到刻板印象，压迫历史，社会运动和其他特定身份的社会背景。
PDF2 years ago
ACLNLP 中的公正性再概念化：以印度为例
本文旨在研究印度社会准则在 NLP 的公正性中的作用，通过对印度社会背景、资源以及文化价值观的分析，建立公正性评估模型，探讨预测偏见和社会刻板印象的存在，并提出改进 NLP 公正性的全面研究议程，为其他地缘文化背景的研究提供借鉴。
PDF2 years ago
机器人表现恶性刻板印象
本文研究了机器学习中存在的偏见、歧视和刻板印象在机器人行为中的表现，实验结果显示，机器人在处理含有种族、性别和固有面相等多种属性的任务时，均表现出毒性刻板印象，并且 CLIP 这类基于大数据集和溶解模型的机器人学习方法在风险管理方面面对着许
PDF2 years ago
KDD公平蒸馏：缓解语言模型的刻板印象
本研究提出了 FairDistillation 方法，使用知识蒸馏构建较小的跨语言语言模型，控制特定偏见，成功缓解刻板印象和代表性危害。FairDistillation 方法可以以较低的成本创建更公平的语言模型。
PDF2 years ago
基于理论的测量 —— 英语语言模型中美国社会刻板印象
本研究使用社会心理学的 Agency-Belief-Communion (ABC) 刻板印象模型来系统地研究和发现语言模型中的刻板印象，提出了敏感度测试（SeT）以测量语言模型中的刻板印象，并将该框架扩展到测量交叉身份的 LM 刻板印象。
PDF2 years ago
[转载] 更差的种子：重现用于偏差度量的词汇方法评估
本文通过对文献进行再现性研究，旨在评估种子词汇的建立是否需要经过彻底的检查，以避免其自身的偏见对测量结果产生负面影响，结果与原文大致相似。
PDF2 years ago
媒体人格化政治中的性别刻板印象：基于词汇、句法和情感分析的实证研究
通过语言、句法和情感分析的方法，本文研究了 2017-2020 年意大利政治官员个人化方面的性别角色问题，并提出了一种计算词汇得分的方法，结果表明政治个人化更加损害女性。女性政治家受到比男性政治家更多的负面言论报道，相信这与某些刻板印象的存
PDF2 years ago
使用遮罩语言建模进行偏见缓解的文本风格转换
本研究提出了一种用于减少偏见的文本风格转换模型，它结合了潜在内容编码和明确的关键词替换，可以更好地保存内容并保持良好的风格转移准确性。
PDF2 years ago
语言模型驱动的对话式推荐系统中的意外偏差
本研究调查了语言模型 LMRec 在餐厅推荐中存在的偏见问题，发现与黑人社区相关的名称的习惯性提及显著降低了推荐餐厅的价格分布，而男性相关的普遍名称的提及则导致增加了推荐的酒类服务场所，这些结果表明了语言模型驱动的推荐系统 LMRec 在其
PDF2 years ago
消费文化中性别偏见的量化
利用自然语言处理和机器学习进行文化演变以及刻板印象和文化变革方面的研究，对过去 50 年间的 25 万首歌曲进行分析，发现歌词中的性别歧视（misogyny）有所减少但仍然存在，女性与理想特质（如能力）的相关性更低。而且，男性艺术家比女性艺
PDF2 years ago
ACLBBQ: 一个手工制作的问答偏见基准
该研究旨在通过提出一种基准数据集 —— 即 Bias Benchmark for QA（BBQ）来测试 NLP 模型的社会偏见。研究发现当上下文信息不充分时，模型通常依赖于固有的刻板印象，导致输出结果中仍存在有害偏见。同时，即便给出充分信息
PDF3 years ago
ACL双倍劣势：预训练视觉与语言模型中的偏见复合
该研究扩展了文本偏差分析方法，以调查多模式语言模型，并分析了这些模型学习的内部和跨模态关联和偏见。具体而言，该研究表明 VL-BERT 展示出性别偏见，往往更喜欢强化刻板印象而不是忠实描述视觉场景。
PDF3 years ago
一个标签，十亿人脸：计算机视觉中种族类别的使用和一致性
本文通过对计算机视觉中的人脸图像进行对比实验，发现虽然数据集中使用的种族类别表面上相似，但每个数据集编码了一个大不相同的种族系统，一些种族类别在数据集间的一致性程度比其他种族类别更低，并且种族类别可能存在刻板印象和忽略某些民族群体的问题，因
PDF3 years ago
EMNLPCrowS-Pairs：一个挑战数据集，用于测试面具语言模型中的社会偏见
该论文介绍了一种基准测试数据 CrowS-Pairs，用于评估预先训练的自然语言模型在涉及到社会偏见方面的表现，结果发现所有评估的模型在 CrowS-Pairs 的每个类别中都偏向于表达刻板印象的句子。
PDF4 years ago
StereoSet：测量预训练语言模型中的陈词滥调偏见
该论文介绍了 StereoSet，一个用于评估英语中预训练语言模型中四种基于性别、职业、种族和宗教的陈规陋习偏见的大规模自然数据集，并评估了 BERT、GPT-2、RoBERTa 和 XLNet 等流行的语言模型在其中的表现，同时呈现了一个
PDF4 years ago
存在隐性偏见情况下的排名干预措施
本研究讨论了设计干预措施的问题，以实现子集选择 - 排序的广义化。我们提出了一系列简单和可解释的约束，并表明它们可以最优地减轻隐性偏见，以及在自然分布的假设下，表现出类似 Rooney Rule 的约束也可以令减少的效用损失性最小。最后，我
PDF4 years ago
关于测量和减轻词嵌入偏见推断的研究
通过自然语言推理任务设计机制，测量陈旧的语义观念对词向量嵌入产生的影响。通过静态和动态嵌入中的偏见消除策略，减少了对其下游模型的无效推断，特别是对性别偏见的消除策略能够扩展到上下文嵌入中静态组件的有选择性应用（ELMo、BERT）。
PDF5 years ago
ACL侦测和消除词向量多类偏差：黑人类比罪犯，白人类比警察
本文介绍了一种多类去偏差词嵌入的方法及其在标准自然语言处理任务中的有效性，防止机器学习模型被嵌入了在线文本中的人类刻板印象和偏见。
PDF5 years ago
词嵌入量化了 100 年来的性别与族裔刻板印象
本文通过将语义学关系嵌入向量，展示词嵌入的时间动态如何被利用来量化美国 20 世纪至 21 世纪对女性和少数民族的刻板印象和态度变化，通过与美国人口普查融合，表明嵌入的变化与时间内的人口和职业转变密切相关，该框架的时间分析为机器学习和数量社
PDF7 years ago