Sep, 2020

通过互信息正则化提高模型抗模型反演攻击的鲁棒性

TL;DR该研究提出了一种基于互信息正则化的防御模型反演攻击的方法,通过限制模型输入中包含的信息,从而限制对手从模型预测中推断出私有属性的能力。此方法能够应用于多种模型并在保护隐私和工具合理性方面取得更好的平衡。