Feb, 2022

参数稀疏性对于贝叶斯深度学习中随机梯度 MCMC 方法的影响

TL;DR本文探讨使用随机梯度马尔科夫链蒙特卡罗方法作为 Bayesian 推理的核心方法,考虑各种选择稀疏网络结构的方法,以灵活地权衡模型存储成本和推理运行时间与预测性能和不确定性量化能力之间的潜力。实验结果表明,某些随机选择的子结构可以像从最先进的迭代剪枝方法中获得的子结构一样表现得很好,同时大大缩短模型训练时间。