ICMLJun, 2018

朝向二值门的鲁棒 LSTM 训练

TL;DR本研究提出了一种新的 LSTM 训练方式,使得门控单元的输出更加容易解释,经过实证研究,发现通过将门控单元的输出值推向 0 或 1,可以更好地控制信息流,从而提高模型的泛化能力和压缩率。