Dec, 2022

文本摘要的逆强化学习

TL;DR本研究使用反向强化学习的方法构建了一个文本摘要模型,通过同时评估摘要代理的奖励函数和优化,我们证明该模型在诸多评测标准中优于 MLE 和 RL 基线模型。