ACLOct, 2021

提升一致性:当你的预训练语言模型未能足够关注时

TL;DR本文研究了大语言模型在长范围语义连贯性方面的问题,提出一种名为 “连贯提升” 的推理方法,能够提高语言模型对长内容的关注,通过分布分析证明了连贯提升的优点,并发现其在零样本自然语言处理任务中也能产生性能提升,而无需额外的训练。