Jan, 2024

对抗机器学习赋能的 OpenWiFi 数据匿名化

TL;DR通过匿名化实现数据隐私和保护是数据拥有者在将数据转发至其他可能用途之前需要解决的关键问题。本文提出了使用 CTGAN 生成的合成数据作为真实数据的替代品,以解决 OpenWiFi 网络中泄露和信息丢失的问题,并通过聚类算法的相似性评估以及无监督聚类验证指标的比较,表明 K-means 算法在合成数据与真实数据的相似性评估上表现出色。因此,实验结果展示了使用 CTGAN 生成的合成数据作为匿名化数据替代品的可行性。