（差分隐私）社会人口数据处理中的公平性问题及其缓解措施

Aug, 2024

（差分隐私）社会人口数据处理中的公平性问题及其缓解措施

Fairness Issues and Mitigations in (Differentially Private) Socio-demographic Data Processes

Joonhyuk Ko, Juba Ziani, Saswat Das, Matt Williams, Ferdinando Fioretto

TL;DR本研究揭示了社会调查中的采样错误如何影响群体水平估计，从而影响决策的公平性。提出了一种基于现实调查设计过程的优化方法，以优化采样成本并维持误差在可接受范围内。同时，研究表明差分隐私下的噪声可以意外减少不公平现象，这一发现可能对数据收集和政策制定产生重要影响。

Abstract

Statistical agencies rely on Sampling techniques to collect Socio-demographic Data crucial for policy-making and resource allocation. This paper shows that surveys of important societal relevance introduce

发现论文，激发创造

差分隐私后处理的偏差和方差

本文首次研究了 post-processing 在差分隐私保护中的性质，尤其在人口普查数据发布中的应用，并从此理论和经验上探讨了广泛采用的一类 post-processing 函数的行为。

Oct, 2020

我们无法测量的，我们就无法理解：追求公平中的人口统计数据采集挑战

研究发现算法公正性从业人员在实践中经常没有获取所需的人口统计数据，这带来了许多难题，其中包括如何平衡隐私与公平、如何定义相关的社会类别、如何确保意义上的同意以及私人公司是否可以推断某人的人口统计信息等，因此在使从业人员可以应对算法偏见方面，必须考虑到企业、监管机构、研究人员和社区团体所面临的挑战。

Oct, 2020

以公平性角度视差分隐私的决策制定

本文研究了不同ially private数据集的发布，并从公平的角度分析它们对一些关键的资源分配任务的影响。结果发现，当决策以differentially private data作为输入时，为了实现隐私而添加的噪声会对某些群体产生不成比例的影响。该论文分析了这些不成比例影响的原因，并提出了减轻这些影响的指导方针。这些方法基于使用differentially private census data的关键决策问题进行了评估。

May, 2021

差分隐私数据的后处理：公平性视角

本研究探讨了不同隐私保护机制中，后处理免疫性质的影响，并分析了在美国人口普查数据分配基金等重大社会决策中，后处理机制引起的不公平影响，提出了一种新的后处理机制，旨在减少公平问题和隐私保护成本。

Jan, 2022

基于人口统计学的算法公平性: 揭示在追求公平性过程中人口统计数据收集的风险

本文探讨了收集人口统计数据用于实现算法公平性所面临的风险和挑战，并呼吁在数据管理和系统性压抑等领域中解决这些问题。

Apr, 2022

披露避免系统的隐私和偏差分析

本文提出了一个框架，旨在解决数据保护系统的隐私和偏见问题，通过提供差分私有版本的安全机制，对 US Census 数据发布和分类任务进行准确度和公平性比较。结果表明，与广泛使用的 DA 机制的差分隐私版本相比，传统的差分隐私技术在准确性和公平性方面可能更优。

Jan, 2023

一个简单实用的方法来减少差异隐私的不均衡影响

通过使用分层方法，可以在不用额外的隐私预算的情况下得到高准确性的全局统计学估计，从而减少差异的工作是减少差异的差异数据隐私机制应该被比较的一个强有力的基线。

Dec, 2023

通过多阶段采样技术（MUST）增强隐私、效用和计算效率的平衡

应用一种随机算法对数据集的子集进行处理，而不是整个数据集，是提高发布信息隐私保护性的一种常见方法。我们提出了一种名为MUltistage Sampling Technique（MUST）的子采样方法类别，用于差分隐私（DP）上的隐私增强（PA）问题。我们通过对几种2级MUST过程（MUST.WO，MUST.OW和MUST.WW）进行全面分析，即在第I阶段从原始数据集中有（W）或没有（O）替代地进行采样，然后在第II阶段从第I阶段中选择的子集中进行有（W）或没有（O）替代地进行采样。我们还通过Fourier accountant算法分析了重复应用MUST时的隐私组合。我们的理论和实验结果表明，在ε方面，MUST.OW和MUST.WW比包括泊松抽样、无替代抽样和有替代抽样的常见一级抽样过程具有更强的PA性能，而在δ方面，结果因情况而异。我们还证明MUST.WO在PA中等效于有替代抽样。此外，由MUST过程生成的最终子集是一个多集，由于涉及有替代抽样，可能包含相同数据点的多个副本，这增强了对需要对不同数据点（如梯度下降）进行复杂函数计算的算法的计算效率。我们的效用实验表明，在相似的隐私损失下，与一级子抽样方法相比，MUST在保留隐私的输出方面提供了相似或改进的效用和稳定性。在需要差分隐私保证时，MUST可以无缝集成到随机优化算法或涉及并行或同时子抽样的方法中（如bagging和子抽样引导）。

Dec, 2023

如何做到公平？对标签和选择偏差的研究

存在情况下，偏见缓解技术能够更准确的模型，在无偏数据上测量时。我们通过对偏见类型和缓解技术的效果建立关系来解决这一问题，并用理论分析来解释实验结果，并展示最小化公平度量并不一定会产生最公平的分布。

Mar, 2024

图上的差分隐私数据发布：低效性与不公平性

本研究针对差分隐私数据发布在网络中的偏差和不公平性问题进行了深入分析，揭示传统方法在实际应用中的不足。通过构建网络发布问题并研究其对最短路径决策的影响，研究表明，差分隐私技术可能导致信息发布中的偏见和不公平分配，显著影响决策效果。该研究为提高隐私保护下的网络决策公正性提供了理论基础与实证证据。

Aug, 2024