Oct, 2020

MEGATRON-CNTRL:基于大规模语言模型的可控外部知识故事生成

TL;DR本文介绍了一个新的框架MEGATRON-CNTRL,通过结合外部知识库,利用大规模语言模型实现生成文本的控制,并由关键字预测器,知识检索器,上下文知识排名器和条件文本生成器四个部分组成。实验结果表明,相较于之前的ROC story数据集,该模型生成更加流畅、一致、连贯且重复率低,差异性高的故事,使用新关键词进行控制后,人类评价结果表明77.5%的故事已经成功受到了控制。同时,由124million经验推广到8.3billion再次展示了大规模模型提高生成质量和控制性能的过程。