Oct, 2017

亲兄弟中辍

TL;DR本文提出了一种名为同胞 dropout 的简单技术,利用 dropout 思想训练两个相同参数的 RNN,通过最小化这些 RNN 的(pre-softmax)预测之间的差异,从而使 RNN 的表示对于dropout 掩码不变。在序列建模和图像字幕任务中达到了最先进的结果。