May, 2023

受限领域中的无学习率贝叶斯推理

TL;DR通过利用凸优化中的 coin betting 思想,将约束取样视为概率测度空间上的镜像优化问题,我们介绍了一套完全不依赖学习率的基于粒子的约束取样算法,并引入了现有约束取样算法的统一框架。数值实验表明,我们的算法在清单、公平约束、后选推理等任务中实现了非常有竞争力的性能,且无需调节任何超参数。