BriefGPT.xyz
Ask
alpha
关键词
over-fitting
搜索结果 - 23
CVPR
DisturbLabel: 在损失层上对 CNN 进行正则化
本文提出了 DisturbLabel 算法,通过在每次迭代中随机替换部分标签为不正确的值,使神经网络模型训练不会出现过拟合,并在几个流行的图像识别数据集上展示了有竞争力的识别结果。
PDF
8 years ago
ICLR
具有伯努利近似变分推断的贝叶斯卷积神经网络
通过在 CNN 的内核上建立概率分布,使用伯努利变分分布来近似模型的不可切合后验,并将 dropout 网络训练视为 Bayesian 神经网络中的近似推理。相比于标准技术,我们的模型在小数据上具备更好的鲁棒性,并在 CIFAR-10 上的
→
PDF
9 years ago
贝叶斯分层专家混合模型
本文提出了一种基于变分推断的 HME 模型的全贝叶斯处理方法,并通过将局部和全局变分方法相结合获得了对模型下数据边际概率的严格下界。
PDF
12 years ago
Prev
Next