Apr, 2024

基于形态学的位置编码研究

TL;DR本研究首次探讨了不同形态结构复杂性的语言中,预训练语言模型(PLMs)中位置编码的重要性如何变化,并囊括了 23 种形态多样的语言和 5 种不同的下游任务。通过选择句法任务和语义任务,我们从各自语言的 BERT 模型中进行研究,实证发现位置编码的显著性随着语言形态复杂性的增加而降低,且观察到语言根据其形态结构的分类呈现聚类现象,其中分析型语言位于一端,而综合型语言位于另一端。