本文研究如何在分布式计算环境中在通信成本约束下,适应一系列随机化算法以在预期的通信成本和估计误差之间进行权衡,实现对一组向量的平均值估计,为分布式优化和学习算法中的 reduce-all 操作提供了一种解决方案。
Nov, 2016
探索分布式学习中维度和沟通成本之间的关系,研究估计未知高维高斯分布均值的问题。同时,提出了一个基于阈值的协议,可在保证相同平方损失的前提下节省通信开销。
May, 2014
本文研究了高维分布统计估计问题的统计误差和通信成本之间的权衡,并提供了分布式稀疏高斯均值估计问题的紧密的权衡分析结果,这直接导致了分布式稀疏线性回归问题的下界,并给出了在稠密情况下均值估计的第一个最优同时协议。
Jun, 2015
分析了两种用于大规模数据集的分布式统计优化的通信有效算法,一种是标准平均法,另一种是基于适当形式的自助子抽样的新算法,实验结果表明两种方法都有效地解决了中文 SoSo 搜索引擎的广告预测问题。
Sep, 2012
研究压缩问题在分布式和联邦学习中的应用,并提供数学模型和算法来比现有方法更加有效率和准确。
May, 2021
本文研究了在通信和局部差分隐私限制下的均值估计问题,提出了一种基于随机旋转的共享代码本的随机化机制,证明了使用随机旋转简单形式码本的 $k$- 最接近编码方法是精确最优的。
Jun, 2023
本文为研究局部隐私约束下的估计方案制定下限,推导出了私有估计和受通信限制的估计问题之间的等价性,适用于任意交互的隐私机制,并且得出了所有不同隐私保护级别的尖锐下限。作者作为对研究结果的一个重要推论,证明了有界或高斯随机向量的均值估计的最小最大均方误差按比例缩放的结论为 $d/n * d/min (ε,ε^2)$ 。
Feb, 2019
该研究提出了一种基于 Kashin 表示和随机抽样的方案以及利用 Walsh-Hadamard 矩阵的递归结构来实现隐私和通信效率的联合优化编码和解码机制,对平均值估计和频率估计等问题进行了研究。
Jul, 2020
研究了在分布式学习中,如何在总通信次数亚线性的情况下通过镜像下降与随机稀疏化 / 量化迭代相结合的算法来实现线性模型的最优误差学习,从而探讨了高维环境下分布式学习的可行性。
在本研究中,我们通过引入一种新的隐私账户方法,将稀疏高斯机制中的稀疏性所固有的随机性结合到差分隐私噪声中,解决了 $L_2$ 均值估计在中心差分隐私和通信约束下的两个关键挑战,并扩展了稀疏化方案到流式差分隐私的矩阵分解框架,为 DP-FTRL 类型的优化器提供了一个精确的账户方法。
May, 2024