May, 2023

深度集成和(变分)贝叶斯方法之间的严密联系

TL;DR本文建立了贝叶斯、变分贝叶斯和集成学习方法之间的第一个数学严谨联系,并将深度学习中常遇到的非凸优化问题重新表述为概率测度空间中的凸优化。我们通过 Wasserstein 梯度流的广义变分推理研究统一理论,这提供了各种看似不相关的方法(包括深度集成和(变分)贝叶斯方法)的不确定性量化,为深度集成算法的成功提供了一种全新视角,并且允许导出具有收敛保证的新集成方案。我们提出了一类具有与热力学中粒子系统相似交互的深度集成系统,并利用我们的理论证明了这些算法会收敛到概率测度空间中的一个明确定义的全局极小值。