Mar, 2018

通信约束下的分布式非参数回归

TL;DR本文研究了分布在多个机器上的数据的非参数平滑函数估计问题,其中每个机器上收集了来自白噪声模型的独立样本,并需要在中央机器上构建潜在真实函数的估计值以及在每台机器上限制了传输信息所需的比特数。我们给出了各种设置下统计风险的渐近下限和匹配上限,并且确定了三个不同的区别(通信预算 / 机器数 / 每台机器上可用数据大小),在这些区别中当通信预算很小时,统计风险仅取决于通信瓶颈,而与样本量无关;在通信预算很大的区域内,与非分布式估计的经典极小风险的情况相同;在一种中间机制中,统计风险取决于样本大小和通信预算。