Apr, 2015

早停法是非参数变分推断

TL;DR本研究使用非参数变分近似后验分布的样本抽取来解释随机梯度下降,为基于最小下限的对数边际似然的超参数优化提供一种输出,包括神经网络等领域。