Mar, 2024

Inf2Guard: 一个信息理论框架用于学习抵抗判断攻击的隐私保护表示

TL;DR机器学习中存在多种推断攻击,现有防御方法要么只针对特定类型的攻击且损失很大,要么很快被自适应攻击突破。本研究提出了一种信息理论防御框架Inf2Guard,用于对抗推断攻击。该框架通过学习共享表示来保护隐私和保留效用,并展示了多种优势及对现有防御的改进。实证评估验证了Inf2Guard对于学习对推断攻击具有隐私保护的表示的有效性,并展示了其优于基线方法的卓越性能。