systemic biases | BriefGPT - AI 论文速递

关键词systemic biases

搜索结果 - 5

统一视角：全球、群体和局部级别上的合理反事实解释
通过梯度优化，引入了一种新的整合方法，为可区分分类模型生成本地、小组和全局反事实解释，以解决全局反事实解释所面临的挑战，并增强了可行性和可信度，从而提高了 AI 模型的可解释性和负责任性。
PDFa month ago
揭示 LLM 生成的对话中的隐蔽伤害和社会威胁
评估 LLMs 生成的对话中的隐蔽伤害时发现，七种 LLMs 表现出了一些恶意观点，特别是在涉及到种姓等非西方概念时更为明显，且用一种看似中立的语言表达，容易逃过现有方法的检测。
PDF2 months ago
手语人工智能研究中的系统偏见：聋人呼吁重新评估研究议程
对手语人工智能领域的 101 篇近期研究论文进行了系统审查，发现该领域存在系统性偏见，缺乏代表性数据集，使用缺乏语言基础的注释以及构建在有缺陷模型上的方法，最终得出结论：该领域需要开放空间，让聋人研究者引领手语人工智能的讨论。
PDF4 months ago
使用条件似然过滤减少语言模型的危害
提出一种从网页规模数据集中识别和过滤有害文本的方法，使用预训练语言模型计算特定文档条件下研究员编写的触发词组的对数似然，并根据该结果识别和过滤数据集中的文档，证明在过滤后的数据集上训练的语言模型产生有害文本的倾向更低，性能与未过滤基线相比略
PDF3 years ago
ACL迈向性别包容的指代消解
了解人物性别问题对人物提及的正确解析极为重要，但有风险引起共指解析系统中的系统偏见，本文从社会学和社会语言学的角度具体阐述如何建立可以认知性别复杂性的共指识别系统，并开发了两个新数据集以此来反映和检验系统偏见。通过对英文文本的研究，证实没有
PDF5 years ago