Dec, 2023

非私有和私有数据的速率最优分类

TL;DR在本文中,我们重新审视了分类的经典问题,但施加了隐私约束。在此约束下,无法直接观察原始数据(X1,Y1),…,(Xn,Yn),并且所有的分类器都是合适的本地差分隐私机制的随机结果的函数。统计学家可以自由选择这种隐私机制的形式,在这里,我们向每个特征向量 Xi 的位置和其标签 Yi 的离散化添加了拉普拉斯分布的噪声。分类规则是经过隐私保护的版本的良好研究分区分类规则。除了标准的 Lipschitz 和边距条件之外,还引入了一种新的特征,通过该特征可以计算出分类误差概率的精确收敛速率,无论是针对非私有数据还是私有数据。