ICLROct, 2018

h-detach:修改 LSTM 梯度以实现更好的优化

TL;DR本文介绍了一种针对长期依赖问题的 LSTM 优化方案,通过采用一种简单的随机算法(h-detach)可以避免梯度消失问题,通过提升梯度在计算图中的表现,进而提高模型优化的鲁棒性效果,使 LSTM 捕获更好的长期依赖关系并在多个基准数据集上显示出显着的性能提升。