May, 2024

利用从摘要模型蒸馏的知识提升长文本理解能力

TL;DR通过使用抽象化摘要生成模型的主旨检测能力,我们提出了 Gist Detector 来加强下游模型对长文本的理解能力,并评估了该方法在长文档分类、远程监督的开放领域问答以及非平行文本风格转换等三个不同任务上的性能表现,结果显示我们的方法在所有任务上都显著提升了基线模型的性能。