ACLApr, 2021

预训练语言模型的话语探测

TL;DR本文使用七种预训练语言模型,运用七种篇章探测任务,将研究重点从句子级别上升到文档级别上,最终发现 BART 是捕获篇章信息能力最好的模型,但只有其编码器部分表现最佳,BERT 作为基准模型也出奇地表现良好,并且不同层次的模型对篇章信息的刻画效果,以及模型之间的差距巨大。