Apr, 2024

去偏分布压缩

TL;DR现代压缩方法可以比独立同分布采样更简洁地概括目标分布 P,但需要访问低偏差输入序列,例如迅速收敛到 P 的马尔可夫链。我们介绍了一套适用于带偏差输入序列压缩的新型压缩方法。在给定 n 个针对错误分布的点和二次时间的情况下,Stein Kernel Thinning (SKT) 返回具有对 P 的最大平均误差 (MMD) 为 O (n^{-1/2}) 的√n 个等权重点。对于更大规模的压缩任务,Low-rank SKT 使用自适应的低秩去偏过程以次二次时间实现相同的效果,该过程可能是独立感兴趣的。对于支持单纯或保持常量权重的下游任务,Stein Recombination 和 Stein Cholesky 具有更大的简洁性,可以与最少的 poly-log (n) 个加权点的 SKT 保证相匹配。这些进展的基础是关于单纯加权负样本集的新保证,核矩阵的谱衰减和 Stein 核希尔伯特空间的覆盖数。在我们的实验中,我们的技术提供了简洁准确的后验总结,同时克服了因预烧、近似马尔可夫链蒙特卡罗和淬火而产生的偏差。