(差分隐私)社会人口数据处理中的公平性问题及其缓解措施
本文首次研究了 post-processing 在差分隐私保护中的性质,尤其在人口普查数据发布中的应用,并从此理论和经验上探讨了广泛采用的一类 post-processing 函数的行为。
Oct, 2020
研究发现算法公正性从业人员在实践中经常没有获取所需的人口统计数据,这带来了许多难题,其中包括如何平衡隐私与公平、如何定义相关的社会类别、如何确保意义上的同意以及私人公司是否可以推断某人的人口统计信息等,因此在使从业人员可以应对算法偏见方面,必须考虑到企业、监管机构、研究人员和社区团体所面临的挑战。
Oct, 2020
本文研究了不同ially private数据集的发布,并从公平的角度分析它们对一些关键的资源分配任务的影响。 结果发现,当决策以differentially private data作为输入时,为了实现隐私而添加的噪声会对某些群体产生不成比例的影响。该论文分析了这些不成比例影响的原因,并提出了减轻这些影响的指导方针。这些方法基于使用differentially private census data的关键决策问题进行了评估。
May, 2021
本研究探讨了不同隐私保护机制中,后处理免疫性质的影响,并分析了在美国人口普查数据分配基金等重大社会决策中,后处理机制引起的不公平影响,提出了一种新的后处理机制,旨在减少公平问题和隐私保护成本。
Jan, 2022
本文探讨了收集人口统计数据用于实现算法公平性所面临的风险和挑战,并呼吁在数据管理和系统性压抑等领域中解决这些问题。
Apr, 2022
本文提出了一个框架,旨在解决数据保护系统的隐私和偏见问题,通过提供差分私有版本的安全机制,对 US Census 数据发布和分类任务进行准确度和公平性比较。结果表明,与广泛使用的 DA 机制的差分隐私版本相比,传统的差分隐私技术在准确性和公平性方面可能更优。
Jan, 2023
通过使用分层方法,可以在不用额外的隐私预算的情况下得到高准确性的全局统计学估计,从而减少差异的工作是减少差异的差异数据隐私机制应该被比较的一个强有力的基线。
Dec, 2023
应用一种随机算法对数据集的子集进行处理,而不是整个数据集,是提高发布信息隐私保护性的一种常见方法。我们提出了一种名为MUltistage Sampling Technique(MUST)的子采样方法类别,用于差分隐私(DP)上的隐私增强(PA)问题。我们通过对几种2级MUST过程(MUST.WO,MUST.OW和MUST.WW)进行全面分析,即在第I阶段从原始数据集中有(W)或没有(O)替代地进行采样,然后在第II阶段从第I阶段中选择的子集中进行有(W)或没有(O)替代地进行采样。我们还通过Fourier accountant算法分析了重复应用MUST时的隐私组合。我们的理论和实验结果表明,在ε方面,MUST.OW和MUST.WW比包括泊松抽样、无替代抽样和有替代抽样的常见一级抽样过程具有更强的PA性能,而在δ方面,结果因情况而异。我们还证明MUST.WO在PA中等效于有替代抽样。此外,由MUST过程生成的最终子集是一个多集,由于涉及有替代抽样,可能包含相同数据点的多个副本,这增强了对需要对不同数据点(如梯度下降)进行复杂函数计算的算法的计算效率。我们的效用实验表明,在相似的隐私损失下,与一级子抽样方法相比,MUST在保留隐私的输出方面提供了相似或改进的效用和稳定性。在需要差分隐私保证时,MUST可以无缝集成到随机优化算法或涉及并行或同时子抽样的方法中(如bagging和子抽样引导)。
Dec, 2023
存在情况下,偏见缓解技术能够更准确的模型,在无偏数据上测量时。我们通过对偏见类型和缓解技术的效果建立关系来解决这一问题,并用理论分析来解释实验结果,并展示最小化公平度量并不一定会产生最公平的分布。
Mar, 2024
本研究针对差分隐私数据发布在网络中的偏差和不公平性问题进行了深入分析,揭示传统方法在实际应用中的不足。通过构建网络发布问题并研究其对最短路径决策的影响,研究表明,差分隐私技术可能导致信息发布中的偏见和不公平分配,显著影响决策效果。该研究为提高隐私保护下的网络决策公正性提供了理论基础与实证证据。
Aug, 2024