Mar, 2018

基于 Actor-Critic 的摘要生成训练框架

TL;DR介绍使用强化学习的演员 - 评论家框架作为神经网络摘要生成模型培训框架,框架中包括政策网络、二进制分类器、修改的最大近似似然度量和参数学习方法,该框架达到了比现有最优秀方法更好的效果。