- WSDM数据中的魔鬼:通过部分知识蒸馏学习公平的图神经网络
通过知识蒸馏的方式,我们提出了一种无需个人信息的人口属性不可知方法 FairGKD 来学习公平的图神经网络 (GNNs),在性能和效益之间取得了平衡,并在多个基准数据集上验证了该方法的有效性。
- 公平绣花:揭示模型拼接在神经网络去偏中的潜力
通过引入一种名为 “The Fairness Stitch (TFS)” 的新方法,该研究评估了在两个著名的数据集 CelebA 和 UTKFace 上采用此方法改进公平性的有效性,并发现在公平性和性能之间取得了平衡的进展,对于解决偏见相关 - 解剖因果偏见
准确测量在基于机器学习的自动决策系统中的歧视是解决子群体和 / 或个体间公平性的重要问题所必需的。本文关注于在生成和 / 或收集训练数据的方式中出现的一类偏见,我们称之为因果偏见,并使用因果关系领域的工具来正式定义和分析此类偏见。本文考虑了 - 利用变分自动编码器为以前不曾见过的用户提供公平的推荐
提出了通过限制种群信息的编码来缓解变分自编码器为基础的推荐系统中的歧视问题的新方法,并对这些方法进行了评估,可以为未在训练数据中表示的用户提供公平的推荐。
- 人工智能驱动的抗菌肽发现
抗菌肽(AMP)和人工智能(AI)在抗菌耐药性方面有着巨大的潜力,提供了一种替代传统抗生素的方法。本文综述了 AI 驱动的 AMP 发现的最新成就,并强调了最激动人心的方向。
- 人员监督软件掺杂分析
本文介绍了一个框架,旨在帮助减轻软件可能带来的社会风险。具体而言,包括软件兴奋剂以及高风险决策系统中的不公平和歧视方面。
- 保险中的人工智能与道德:缓解风险模型中的代理歧视的新解决方案
机器学习在伦理学、保险定价和风险选择方面面临着人们日益关注的议题,本研究探讨了间接性歧视的风险,并提出了一种基于线性代数的创新方法来降低间接性歧视的风险,以提高保险的公平性和性能表现。
- 基于保序干预分布的因果公平机器学习
若以相等的人受到相同待遇,不相等的人受到不同待遇定义决策为公平,采用此定义,设计机器学习模型以减少自动决策系统中的不公平必须引入保护属性时进行因果思考。根据近期提出的建议,我们将个体定义为在一个虚构的、规范化的期望(FiND)世界中相等,该 - AI 普惠的挑战与解决方案
人工智能的普遍存在和多样性需要在其设计中考虑到公平、信任和透明性的多样性和包容性原则,然而,这些考虑往往被忽视,导致偏见、歧视和不可信任的问题。本研究通过系统回顾挖掘了与人工智能中的多样性和包容性相关的挑战和解决方案,研究结果包括 55 个 - 夺回视野:针对带有大值范围的时间序列数据的新型可视化设计
通过引入两种新颖的可视化设计,我们支持从业者在时间序列数据的大范围值(即多个数量级)上进行识别和区分任务:(1)数量级视域图扩展经典视域图;(2)数量级折线图调整对数折线图。这些新的可视化设计通过显式地拆分值 v = m * 10e 的尾数 - 朝向无需假设的偏见缓解
通过建模特征交互来检测相关属性以减轻偏见影响的无假设框架,大大减轻了机器学习模型中针对特定人群的歧视和不公平预测行为。
- 标签噪音校正对机器学习公正性影响的系统分析
通过实证方法,我们评估了六种标签噪音修正方法在多个公正度度量标准上的表现,结果表明混合标签噪音修正方法在预测性能和公正度之间取得了最佳平衡,而基于聚类的修正方法可以最大程度地减少歧视但降低了预测性能。
- Wasserstein 重心在保险业中的歧视缓解
该研究探究了机器学习风险预测模型对于敏感特征如性别或种族歧视的问题,提出了使用 Wasserstein barycenters 减轻该问题并在实际数据上进行了验证。
- 机器学习中的低表示和抽样偏差问题探讨
本文介绍了通过采样偏差分析和定义样本大小偏差和代表性偏差,以及探讨借助企图收集欠代表的群体样本来处理歧视的观点。
- 协调预测和统计平等:因果方法
通过对统计平等和预测平等的关系进行原因分解,我们得出了一种新的公式,使得两种平等概念不互斥,而是互补的,并通过业务必要性的理念涵盖了公平性概念的一系列光谱,最终我们通过真实世界的案例证明了我们发现的重要性。
- 运动如女孩!语言和视觉中的体育性别偏见
该研究分析了两个语言和视觉数据集的性别偏见,发现数据集对女性存在偏差,而且人类命名体育运动参与者时也存在性别偏见,这导致了数据集和模型对女性的不当代表。
- ChatGPT 作为文本简化工具去除偏见
对语言模型所训练的某些人群的特定语言信号的存在进行研究,发现这可能导致歧视。本文探讨一种减少偏见的可能技术,即简化文本,实验结果表明,对于简化的数据,预测敏感属性的分类器准确性下降了最多 17%。
- 社会正义算法:社交网络中的平权行动
本文倡导实现社会公正,提出 ERA-Link 算法,利用谱图理论反对不公,并通过四个评估指标的实验,证明 ERA-Link 能够在不仅仅是弱势群体的情况下改善社交网络结构,并促进整体社交资本的增加和创新机会的提升。
- 通过鲁棒性选择特征以应对维度灾难
提出了一种新方法,该方法根据内在维度的计算,选择可区分数据子集的特征,有助于降低高维度和特征选择的困扰。实验证明该方法优于传统方法,并可在含数百万个数据点的数据集上应用。
- 使用现成的机器学习工具,以超过 99% 的准确率区分作者身份:ChatGPT 还是学术科学家?
通过监督分类的方法,我们开发了一种方法来辨别人工智能生成的文本和学术科学家的文本,其中包含 20 个特征,最终建立了一个模型准确地判断了文本的作者,使得误分类文档的数量减少至原来的 1/20。