BriefGPT.xyz
Ask
alpha
关键词
nll pretrained model
搜索结果 - 1
ACL
RewardsOfSum: 探索用于摘要生成的强化学习奖励
该研究提出了两种用于抽象摘要任务的奖励函数:RwB-Hinge 和 RISK。实验结果表明,这些函数在以 NLL 为基线的基础上实现了一致的性能提升。
PDF
3 years ago
Prev
Next