Aug, 2024

模型对称性下变分推断失败:用于贝叶斯神经网络的置换不变后验

TL;DR本研究解决了神经网络架构中的权重空间对称性(如MLP中的置换对称性)所导致的贝叶斯神经网络后验的多模态性问题。这项工作提出了一种对称化机制,以构建置换不变的变分后验,结果显示此方法显著提高了后验拟合效果和预测性能。