Aug, 2017
神经序列模型端到端训练的连续松弛束搜索
A Continuous Relaxation of Beam Search for End-to-end Training of Neural Sequence Models
Kartik Goyal, Graham Neubig, Chris Dyer, Taylor Berg-Kirkpatrick
TL;DR本报告提出了一种新的神经序列模型的训练方法来更好地利用束搜索算法,该方法通过引入介绍连续逼近束搜索的新方法来形成一个次微分的替代目标,在 Named Entity Recognition 和 CCG Supertagging 两个序列任务的实验中,优化此新的训练目标能够比交叉熵训练的贪婪解码和交叉熵训练的束搜索解码基线都得到实质性的改善。