Jan, 2022

高效的抽象摘要数据增强

TL;DR本文介绍了一种针对抽象摘要任务的低成本、高效的数据扩充策略,ExtraPhrase,通过提取性摘要和改写两个步骤来构建伪训练数据,实验证明 ExtraPhrase 相比不使用数据扩充的设置在 ROUGE 指标上提高了超过 0.50 分,并且超过了现有的方法,尤其在低资源设置下表现出明显提升,同时 ExtraPhrase 比现有方法更加成本效益高。