ACLJun, 2021

RewardsOfSum: 探索用于摘要生成的强化学习奖励

TL;DR该研究提出了两种用于抽象摘要任务的奖励函数:RwB-Hinge 和 RISK。实验结果表明,这些函数在以 NLL 为基线的基础上实现了一致的性能提升。