ICMLSep, 2021

机器学习预处理技术的统计隐私保障

TL;DR该论文旨在弥补当前机器学习流程中,尤其是数据预处理阶段中存在的隐私保护鸿沟,该研究使用一种基于统计学方法的隐私侵犯检测框架来实验性地测量机器学习管线的隐私级别,并应用这一新创建的框架来表明针对不平衡数据的重抽样技术会导致模型泄露更多隐私,强调了需开发私有的预处理技术。