EMNLPOct, 2021

DiscoDVT: 使用意识到语篇的离散变分变换器生成长文本

TL;DR本文提出 DiscoDVT:一种基于离散变分 Transformer 的话语感知模型,用于帮助预训练语言模型生成保持长距离连贯性的长文章。通过学习一个可以概括全文结构的离散变量序列,并利用其指导每个解码步骤的生成过程。试验表明,离散编码与话语结构有显著联系,提高长段连贯性。