ACLAug, 2021

受限马尔科夫决策过程控制的摘要

TL;DR本研究通过引入基于约束马尔可夫决策过程(CMDP)的训练框架,允许用户对生成的摘要进行特定属性(例如长度限制)的控制,该框架旨在通过奖励函数和一组约束来提高摘要生成的可控性。实验结果表明,我们的 CMDP 框架有助于生成具有信息量的摘要,并符合用户对属性的要求。