经过分值校准的阈值无关公平匹配
本研究旨在展示 FairEM360 框架,它能够通过多种公平性测量和范式审计实体匹配器的输出,提供潜在的不公平原因解释,并通过人为回馈的探索过程以及多个匹配器的集成来解决不公平问题,从而帮助提高评估 EM 管道的公平性考虑。
Apr, 2024
本研究建立了新的实体匹配(EM)语料库和重构 EM 基准来挑战以前 EM 基准构建过程中的关键性假设,实验证明以往基准构建过程中的假设与开放环境不符,掩盖了 EM 任务的主要挑战。
May, 2022
我们提出了一种测试评分排序系统公平性的方法,称为匹配双校准。我们的方法构建了一组匹配的项目对,这些项目对子组之间的混杂差异最小,然后在集合中计算适当的排名误差度量,并确保比较相同评分的项目子组结果,以便测量绩效差异直接暗示着子组水平的不公平性。
Jun, 2023
在群体公平约束下考虑了二元分类问题,通过引入一种新的偏见量度,称为偏见分数,提出了贝叶斯最优分类器的显式特征,并基于该特征开发了一种满足公平约束且保持高准确率的事后方法。该方法在 Adult、COMPAS 和 CelebA 数据集上与内处理和事后处理方法相比性能竞争力更好,不同于大多数事后处理方法,我们在推断时不需要访问敏感属性。
Oct, 2023
通过将与预测相关的分布属性纳入考虑,我们扩展了人口平等的概念,允许专家知识在公平解决方案中得到应用,并通过一个工资的实际案例说明了此新度量的使用,同时开发了解决实际挑战的参数方法,提供了一个适用于现实生活中应用场景的强大解决方案。
Oct, 2023
本文提出一种用于多任务学习的算法公平性方法,该方法通过使用多项 Wasserstein barycenter 扩展 “Strong Demographic Parity” 的定义,为具有回归和二分类任务的多任务学习器提供了封闭形式解决方案,并应用于合成和现实数据集上以展示其在促进公平决策方面的实际价值。
Jun, 2023
实体匹配是实际数据管理系统中最重要的任务之一,传统的无监督多表实体匹配方法不够有效和高效,因此本文提出了一种名为 MultiEM 的解决方案,通过增强实体表示、层级合并和基于密度的修剪,实现了高效而有效的无监督多表实体匹配。
Aug, 2023