Jan, 2024
不要总是看向右边:探究基于解码器的大型语言模型在序列标注中的能力
Do Not (Always) Look Right: Investigating the Capabilities of Decoder-Based Large Language Models for Sequence Labeling
David Dukić, Jan Šnajder
TL;DR提前训练的语言模型能够通过改进序列标记任务的表现,优于基于自回归语言模型的编码器,并通过去除因果掩码在信息提取任务中取得了与前沿模型相媲美的性能。