Sep, 2024
通过多语言主谓一致探讨句子嵌入中的句法信息
Exploring syntactic information in sentence embeddings through
multilingual subject-verb agreement
TL;DR本研究旨在探讨多语言预训练语言模型在捕捉跨语言的抽象语言表示方面的能力,填补了现有研究中的空白。我们提出了一种新的方法,通过大规模合成数据集和多项选择任务,研究句子中主谓一致的句法现象。研究发现,尽管模型在多语言文本上进行了一致训练,但仍存在语言特定的差异,句法结构并不共享,即使在相关语言之间亦是如此。