May, 2024

自适应在线贝叶斯频率分布估计与局部差分隐私

TL;DR我们提出了一种新颖的贝叶斯方法,用于局部差分隐私 (LDP) 框架下有限类别频率分布的自适应在线估计,并通过后验抽样进行贝叶斯参数估计,使基于获得的后验样本调整 LDP 的随机化机制。我们提出了一种基于随机化机制的 LDP,它使用类别子集作为输入,并且其性能取决于所选择的子集和真实频率分布。通过使用后验样本作为频率分布的估计,算法执行可计算子集选择步骤,以最大化下一个用户的隐私响应效用。我们提出了几个与著名信息度量相关的效用函数,如 Fisher 信息矩阵、总变差距离和信息熵。我们比较了每个效用度量在计算复杂度方面的差异。我们采用随机梯度 Langevin 动力学进行后验抽样,这是一种计算高效的近似马尔可夫链蒙特卡洛方法。我们提供了理论分析,证明了算法所针对的后验分布收敛于真实参数,即使进行了近似后验抽样;如果进行了精确的后验抽样,算法将具有高概率选择出最佳子集。我们还提供了数值结果,通过在不同隐私参数和人群分布参数的实验设置下与非自适应和半自适应方法进行比较,经验证明了我们算法的估计精确性。