Dec, 2022

预训练语言模型用于关键词生成的彻底实证研究

TL;DR本文深入研究了基于预训练语言模型(PLMs)的关键短语抽取和生成的设计选择及其表现,发现在领域内使用类 BERT 的 PLMs 可以用于构建强大且数据有效的关键短语生成模型。而在固定参数预算的情况下,将模型深度优先于模型宽度,将更多的层分配给编码器,能够带来更好的编码器 - 解码器模型的表现。同时,在引入四个领域内的 PLMs 后,本文在新闻领域中实现了有竞争力的表现,在科学领域中实现了最先进的表现。