CVPRAug, 2017

Noisy Softmax:通过推迟早期 Softmax 饱和来提高 DCNN 的泛化能力

TL;DR本研究提出 Noisy Softmax 方法来解决 CNN 中 softmax 的饱和问题,通过注入退火噪声来推迟 softmax 的饱和,进一步带来连续的梯度传播以鼓励 SGD 求解器更具探索性,并提高 CNN 模型的泛化能力。实验证明这种方法在许多任务中都有很好的优化效果,并在几个流行的基准数据集上取得了最先进的或具有竞争力的结果。