NIPSOct, 2016

基于 “惊奇度” 的 Zoneout

TL;DR本文提出了一种新颖的递归神经网络正则化方法,称为 surprisal-driven zoneout,在该方法中,当 surprisal(上一状态的预测值与目标值之间的差异)较小时,状态会 zoneout(保持其先前的值而不更新),从而达到逐神经元基础上的自适应正则化。作者在 Hutter Prize 维基百科数据集上实现了 1.31 的 bits per character,显著缩小了到目前为止最好的高度工程化压缩方法之间的差距。