sensitive attribute | BriefGPT

关键词sensitive attribute

搜索结果 - 5

ICLR自然语言处理中的人类辅助公正分类
本研究提出了使用无监督风格转移和 GPT-3 的零 - shot 技术发现具有表达性和直观性的个体公平规范的新方法，以解决文本分类器中公平性问题。我们使用众包研究验证了所生成的具有人类直觉的公平排除敏感属性的语句对，并展示了有限数量的人类反
PDF2 years ago
AAAI随机量化神经网络在不变表示学习中的应用
本文提出了一种通过直接计算神经层和敏感属性之间的互信息来实现公平表示的方法，该方法利用了基于随机二值化神经网络的 representation learning 算法，相对于全精度神经网络，该方法的学习表示具有更高的不变性。
PDF2 years ago
路径特定的反事实公平性
在复杂情景中，针对敏感因素同时影响公平和不公平决策的情境下，本文提出了采用因果学方法来消除不公平路径效应的模型，并利用深度学习和近似推理实现了一个广泛适用于复杂非线性场景的解决方案。
PDF6 years ago
当对抗性学习公平表征时的数据决策与理论含义
本文研究通过对抗训练神经网络来消除敏感属性信息从而实现分类器 “公平” 的方法。发现只需要少量数据即可训练出具有公平性的分类器，并且数据分布影响对手的公平概念。
PDF7 years ago
线性重构攻击的威力
研究重构攻击在统计数据隐私方面的应用，并展示其可以适用于比以前更广泛的领域。我们说明如何将一系列发布转化为线性格式，从而使它们可以使用多项式时间重构算法。
PDF12 years ago