COLINGFeb, 2024

语言知识可以增强编码器 - 解码器模型(如果你愿意)

TL;DR本文探讨了将预训练的编码 - 解码模型(特别是 T5)与语言知识相结合用于预测目标任务时的影响。我们研究了在预测句子的结构语言属性的中间任务上微调 T5 模型是否会改变其在预测句子级复杂性目标任务上的性能。我们的研究包括在意大利语和英语数据集上进行的各种实验,使用了单语和多语 T5 模型以及不同尺寸的模型。无论是在两种语言还是在跨语言配置中,结果表明,从语言学角度出发的中间微调通常对目标任务的性能有积极影响,特别是在模型较小且数据有限的情况下。