Jan, 2017

未来成功学习解码

TL;DR介绍了一种简单的、通用的策略,通过插值算法将 MLE-based 令牌生成策略的演员与能够估计所需属性的价值函数批判家结合来修改神经解码器的行为,从而生成具有特定属性(例如,预定长度的序列)的输出。该方法不仅能处理序列长度和后向概率等多种无法通过标准神经序列解码器处理的属性,而且在优化 BLEU 或 ROUGE 得分时能够持续改善概括性摘要和机器翻译。