LLMs 对抑郁预测的数量和质量性别公平性研究

Jun, 2024

LLMs 对抑郁预测的数量和质量性别公平性研究

Underneath the Numbers: Quantitative and Qualitative Gender Fairness in LLMs for Depression Prediction

Micol Spitale, Jiaee Cheong, Hatice Gunes

TL;DR最近的研究表明，许多机器学习模型在抑郁症检测方面存在偏见，但是对于此任务中 LLMs 的偏见尚未被探索。本文首次尝试使用定量和定性方法研究现有 LLMs（ChatGPT，LLaMA 2 和 Bard）中存在的性别偏见程度。通过我们的定量评估，我们发现 ChatGPT 在各种性能指标上表现最佳，而 LLaMA 2 在群组公平度指标方面表现优于其他 LLMs。鉴于定性公平性评估仍然是一个未解决的研究问题，我们提出了几种策略（例如词频统计，主题分析），以调查定性评估是否可以为偏见分析提供超越定量评估的有价值的见解。我们发现，与 LLaMA 2 相比，ChatGPT 在预测解释方面始终提供更全面、更合理的解释。我们还确定了 LLMs 采用的几个主题，用于对性别公平性进行定性评估。我们希望我们的研究结果能成为未来改进 LLMs 公平性定性评估的起点，尤其是对于抑郁症检测等重要任务。

Abstract

Recent studies show bias in many machine learning models for depression detection, but bias in →

machine learning models bias llms gender bias depression detection

发现论文，激发创造

ChatGPT 的公正性

本文旨在系统评估 ChatGPT 在高风险领域中的表现，并考虑使用有偏或无偏提示时 ChatGPT 输出中的差异，以实现 LLM 的公平性能的深入理解，促进偏见缓解和负责任人工智能系统的发展。

May, 2023

利用大型语言模型揭示和缓解心理健康分析中的偏见

大型语言模型的进展展示了在各个应用领域的强大能力，包括心理健康分析。然而，现有的研究着重于预测性能，对公平性这一关键问题的探讨不足，给弱势人群带来了重大风险。我们通过针对八个不同的心理健康数据集，使用十种不同的提示方法，系统地评估了七个社会因素的偏见。结果表明，GPT-4 在性能和公平性方面实现了最佳的平衡，尽管在某些情况下仍落后于领域特定模型如 MentalRoBERTa。此外，我们针对公平性进行调整的提示方法可以有效减轻在心理健康预测中的偏见，凸显了在该领域进行公平分析的巨大潜力。

Jun, 2024

探测大型语言模型中的未预料偏见

通过探索新的方法来检测大型语言模型中的潜在偏见，本研究聚焦于不确定性量化和可解释人工智能方法，旨在提高模型决策的透明性，以识别和理解不明显的偏见，从而为更加公平和透明的人工智能系统的发展做出贡献。

Apr, 2024

评估 LLMs 在著名人士中的性别差异

该研究评估了大型语言模型对获取事实信息的使用，特别研究了这些模型在回答问题时可能产生错误回答或完全拒绝回答的倾向，并重点调查了性别差异在模型回答中的存在。研究结果显示 GPT-3.5 生成的回答存在明显性别差异，尽管 GPT-4 的进展改善了性能，但并未完全消除这些性别差异，特别是在回答被拒绝的情况下。研究进一步探讨了提示中性别相关性和回答的同质性对这些差异的影响。

Mar, 2024

少样本公平性：揭示 LLM 对公平感知分类的潜力

利用大型语言模型（LLM）在各种下游应用中进行分类等工作至关重要，通过公平性可以确保包容性，基于种族、性别等因素实现平等代表和促进负责任的人工智能部署。本研究引入了一个框架来概述与各种公平性定义相一致的公平性规定，每个定义均由不同程度的抽象调控。我们通过在流程中将公平规则纳入，并使用 RAG 选择上下文演示来探索上下文学习的配置和过程。通过与不同 LLM 的实验比较，发现 GPT-4 在准确性和公平性方面的结果都优于其他模型。本研究是利用 LLMs 通过上下文学习实现预测任务公平性的早期尝试之一。

Feb, 2024

JobFair: 大规模语言模型中评估性别招聘偏见的框架

基于大型语言模型的层次性性别招聘偏见评估框架揭示了反向偏见和过度去偏见的重要问题。

Jun, 2024

揭示法学硕士职业领域中的性别偏见：分析与解决社会学意义

该研究探讨了大型语言模型中的性别偏见问题，特别关注 GPT-2 和 GPT-3.5 等多个语言模型之间的比较，通过对生成的文本进行全面的文献综述和定量分析，发现了性别化词汇关联、语言使用和偏见叙述的问题，并提出了减少性别偏见的算法和数据增强技术。该研究强调了学科间合作的重要性和社会学研究在减少 AI 模型性别偏见中的作用。

Jul, 2023

大型语言模型中的性别偏见煽动与缓解之学习

自动检测大型语言模型（如 ChatGPT 和 GPT-4）潜在性别偏见的研究，提出了一种自动生成测试用例的方法，并通过这些测试用例来减轻模型偏见，从而实现更公正的回复。

Oct, 2023

大型语言模型的排名公平性实证研究

该研究通过使用 TREC 公平排名数据集对大型语言模型（LLMs）进行了实证研究，重点关注性别和地理位置等二元受保护属性的表示，以揭示它们在排序算法中的偏见，从用户和内容角度评估公平性，为评估 LLMs 作为公平排序器提供了实证基准。

Apr, 2024

在大型语言模型推荐中评估 ChatGPT 的公平性

本研究旨在评估通过大语言模型实现的推荐系统中潜在的社会偏见问题，针对传统推荐系统的不足，提出了一个新的名为 FaiRLLM 评估标准和一套评估指标来评估这一问题。通过该标准，对 ChatGPT 进行评估，发现其在生成推荐时仍然存在对某些敏感属性的不公平性展现。

May, 2023