ACLApr, 2022

长上下文 NLP 模型中效率与准确性的权衡特征

TL;DR本文对自然语言处理中的长文本序列建模技术进行了深入的研究,通过使用两种常见的长序列模型 ——LED 和 Big Bird,实验分析了模型大小、输入序列长度等因素对其性能表现的影响。发现在精准性、速度和能耗之间存在着权衡,其中 LED 模型在较低的能耗代价下达到了更好的精确度,且模型的性能表现受到超参数的影响。同时,当模型大小和输入序列长度发生变化时,我们还发现了在文本摘要和问答场景下不同的性能优化策略。