Feb, 2018

结构化预测与注意力的可微分动态规划

TL;DR本文提出了一种新的方法,在动态规划算法的递归过程中使用强凸正则化器平滑极大算子,以使一类DP算法变得可微分,从而解决DP算法在神经网络中无法使用反向传播训练的问题,同时实例化了两个平滑算法,并在结构化预测任务和神经机器翻译中测试了其性能。