本文针对过拟合问题,提出了一种适用于自适应数据分析的算法,使用保留集重复验证后得到的假设,避免了过度拟合问题,同时利用描述长度和差分隐私,展示了在适应性场景下保证统计有效性的方法,并通过近似最大信息的方法将这些方法统一起来。
Jun, 2015
本论文利用差分隐私算法对分布式和流数据进行分析,通过学习全局数据模型并保障差分隐私,提出了三种分布式学习贝叶斯网络模型的新方法,并针对流数据中的用户密度估计问题,提供了用户级别的隐私保护算法和改进策略。
Jul, 2023
本文主要介绍了一种基于近似中位数算法的算法来估算统计数据集的普适性,该算法满足差分隐私的强稳定性保证,解决了统计数据集在自适应问题上的泛化保证的新方法。
Jun, 2017
提出了基于贝叶斯的差分隐私方法,并实验表明基于样本数据分布的隐私保护方法比传统方法更实用有效。
Jan, 2019
通过研究选择性分类器在差分隐私约束下的效果,探讨深度学习模型的可靠性及隐私泄漏问题,发现最近的一种基于现成的深度学习模型生成检查点的方法在差分隐私下更为合适,使用差分隐私不仅会降低模型的效能,而且在隐私预算降低时需要付出相当大的覆盖成本。
May, 2023
本文探讨了在分散式数据环境下,采用局部差分隐私保护敏感数据的可行性,设计了最优局部差分隐私机制,实现了在大规模数据训练下保护隐私,同时保证模型准确性。
Dec, 2018
本文主要研究如何将差分隐私的保护机制融入多元线性回归建模中,并提出了一种基于惩罚最小二乘估计和随机化的算法来实现此目标,该算法在最优化时更加敏感于参数的选择,但保证了与非差分隐私的程序同样的一致性。
Jul, 2016
在该研究中,我们提出了基于模拟的隐私保护数据集推理方法,利用神经条件密度估计器近似后验分布,纠正隐私保护机制引入的偏差,并展示了隐私与效用之间的权衡的必要性和可行性。
Oct, 2023
关于如何在自适应数据分析中保证统计推断的有效性的研究,使用隐私保护技术协调估计值,并在估计指数数量的期望时取得了指数级的改进,适用于多重假设检验和虚假发现率控制。
Nov, 2014
本文研究了在差分隐私约束下的线性回归问题,恢复了特征、标签和系数域在优化误差和估计误差中的正确依赖性,并提出了两种简单修改的差分隐私算法:后验采样和充足统计扰动,并展示它们可升级为能针对每个实例利用数据相关量并行为几乎最优的自适应算法。作者在 36 个数据集上进行了广泛的实验,结果表明两种自适应算法优于现有技术。
Mar, 2018