May, 2023

应用不同技术的机器学习模型对匿名数据的比较

TL;DR通过使用基于值通用化层次结构的匿名化技术来模糊准标识符,广泛用于实现预设的隐私级别。本文研究了四种经典的机器学习方法,以分类为目的,分析了应用匿名化技术和为每个方法选择的参数的结果。使用广为人知的成年人数据集,在变化的 K 值、L - 多样性、T - 接近度和 delta 披露隐私方面部署这些模型的性能得到了研究。