经过分值校准的阈值无关公平匹配

May, 2024

经过分值校准的阈值无关公平匹配

Threshold-Independent Fair Matching through Score Calibration

Mohammad Hossein Moslemi, Mostafa Milani

TL;DR在数据清洗中特别是在实体匹配任务中，本文提出了一种生成匹配分数的方法，以减少不同阈值下的偏见，从而减少数据清洗领域中的偏见。

Abstract

entity matching (EM) is a critical task in numerous fields, such as healthcare, finance, and public administration, as it identifies records that refer to the same entity within or across different databases. EM faces considerable challenges, particularly with false positives and negat

entity matching matching scores fairness biases data cleaning

发现论文，激发创造

公正视角下的实体匹配实验分析与评估

通过大规模实验证明了实体匹配算法的公平性存在潜在的不足，特别在现实社会中出现一些特定条件下的人口群体过多代表性和名字相似度不同的群体之间。

Jul, 2023

FairEM360: 负责任实体匹配套件

本研究旨在展示 FairEM360 框架，它能够通过多种公平性测量和范式审计实体匹配器的输出，提供潜在的不公平原因解释，并通过人为回馈的探索过程以及多个匹配器的集成来解决不公平问题，从而帮助提高评估 EM 管道的公平性考虑。

Apr, 2024

实体匹配的现实与理想之间的沟通：一个重访和基准重建

本研究建立了新的实体匹配（EM）语料库和重构 EM 基准来挑战以前 EM 基准构建过程中的关键性假设，实验证明以往基准构建过程中的假设与开放环境不符，掩盖了 EM 任务的主要挑战。

May, 2022

排名公平性匹配对校准

我们提出了一种测试评分排序系统公平性的方法，称为匹配双校准。我们的方法构建了一组匹配的项目对，这些项目对子组之间的混杂差异最小，然后在集合中计算适当的排名误差度量，并确保比较相同评分的项目子组结果，以便测量绩效差异直接暗示着子组水平的不公平性。

Jun, 2023

后期偏倚评分在公平分类中的最优选择

在群体公平约束下考虑了二元分类问题，通过引入一种新的偏见量度，称为偏见分数，提出了贝叶斯最优分类器的显式特征，并基于该特征开发了一种满足公平约束且保持高准确率的事后方法。该方法在 Adult、COMPAS 和 CelebA 数据集上与内处理和事后处理方法相比性能竞争力更好，不同于大多数事后处理方法，我们在推断时不需要访问敏感属性。

Oct, 2023

朝着阈值不变的公平分类

本文提出了门槛不变的公平性的概念，通过两种近似方法来均衡不同群体之间的风险分布，实现了对机器学习模型公平性的提高。

Jun, 2020

公正和校准

本论文探讨了在不同人群中最小化误差差异和维护校准概率估计之间的紧张关系，并表明校准只与单一误差约束兼容。

Sep, 2017

具有统计保证的参数公平性

通过将与预测相关的分布属性纳入考虑，我们扩展了人口平等的概念，允许专家知识在公平解决方案中得到应用，并通过一个工资的实际案例说明了此新度量的使用，同时开发了解决实际挑战的参数方法，提供了一个适用于现实生活中应用场景的强大解决方案。

Oct, 2023

通过 Wasserstein Barycenters 实现多任务学习的公平性

本文提出一种用于多任务学习的算法公平性方法，该方法通过使用多项 Wasserstein barycenter 扩展 “Strong Demographic Parity” 的定义，为具有回归和二分类任务的多任务学习器提供了封闭形式解决方案，并应用于合成和现实数据集上以展示其在促进公平决策方面的实际价值。

Jun, 2023

MultiEM: 高效且有效的无监督多表实体匹配

实体匹配是实际数据管理系统中最重要的任务之一，传统的无监督多表实体匹配方法不够有效和高效，因此本文提出了一种名为 MultiEM 的解决方案，通过增强实体表示、层级合并和基于密度的修剪，实现了高效而有效的无监督多表实体匹配。

Aug, 2023