Nov, 2017

深度强化学习在全局策略下用于基于查询的提取式摘要

TL;DR本文提出一种应用基于策略梯度算法的深度强化学习系统的证明性方法,以解决文本摘要中标签不匹配问题,使用无折扣奖励学习具有简单神经网络和简单特征的策略,验证结果表明在全局策略下具有鼓舞人心的表现。