评估基于Transformer的多语言语言模型的句法能力

May, 2021

评估基于Transformer的多语言语言模型的句法能力

Assessing the Syntactic Capabilities of Transformer-based Multilingual Language Models

Laura Pérez-Mayos, Alba Táboas García, Simon Mille, Leo Wanner

TL;DR本研究探讨了Bert和RoBERTa等单语和多语版本的句法泛化能力，使用SyntaxGym测试套件和其在西班牙语中的替代品SyntaxGymES对英语和西班牙语进行了测试。

Abstract

multilingual transformer-based language models, usually pretrained on more than 100 languages, have been shown to achieve outstanding results in a wide range of cross-lingual transfer tasks. However, it remains unknown whether the optimization for different languages conditions the cap

发现论文，激发创造

Multilingual BERT在语言生成方面是否流利？

本文探讨了多语言 BERT 模型在语言编码、语法特性、语言生成等任务上的表现，发现该模型性能低于单语言模型，在某些情况下无法取代单语言模型，尤其在北欧语言方面表现不足。

Oct, 2019

XTREME: 用于评估跨语言通用化的大规模多语言多任务基准数据集

该论文介绍了一个名为XTREME的跨语言多任务基准测试，它可以在40种语言和9个任务上评估多语言表示的跨语言泛化能力，研究表明，跨语言模型在句法和句子检索任务上的性能仍有相当大的差距，该基准测试旨在促进跨语言学习方法的研究。

Mar, 2020

跨语言句法评估词预测模型

通过多语言的句法评估套件CLAMS，调查神经词语预测模型在各种语言中学习语法的能力，结果表明单语LSTMs在句子成分及吸引子存在时达到了很高的精度，而在其他方面的一致性准确率较低，多语言模型通常表现不如单语模型。

May, 2020

神经语言模型中的语法推广的系统评估

我们对神经语言模型的句法知识进行了系统评估，发现模型架构的不同对句法泛化性能产生了显著影响，而不同数据集大小的影响相对较低。

May, 2020

Transformer 语法：在规模上增强具有语法归纳偏见的转换语言模型

Transformer Grammars是一种新颖的语言模型，通过特殊的注意力掩码和确定性转换实现递归句法组合，提高了句子级别和句法敏感的语言建模性能，在长文本建模中，递归的句法组合对表示整个句子向量造成了瓶颈并影响了逼近度，表明一个独立于组合句法表示的不同类型的记忆机制在当前成功的模型中发挥了重要作用。

Mar, 2022

多语言BERT有口音：评估英语对多语言模型流畅性的影响

研究发现多语种模型中高资源语言的语法结构会渗透到低资源语言中，给跨语言模型性能带来偏差。

Oct, 2022

西班牙语语言模型评估中得到的经验教训

本文提供了一份全面的研究报告，比较了用于西班牙语的语言模型，报告显示：先前被忽略的大型跨语言模型比单语模型表现更好，单语模型的结果并不是确定性的，需要进一步研究语料库大小、质量和预训练技术等因素。

Dec, 2022

评估语言模型中的语言推广能力：面向巴西葡萄牙语的数据集

本研究提出了一种评估方法，针对用于巴西葡萄牙文的语言模型，通过固定的语言格式，考察语言信息的编码方式，评估不同的语言模型在处理语法结构和多词表达方面的泛化能力，解决了语言模型黑盒且缺乏可解释性的问题。

May, 2023

IndicSentEval：多语言变换模型在印度语言中有效编码语言特性的研究

本研究解决了多语言变换模型在印度语言中的编码能力和鲁棒性问题，填补了现有研究仅集中在英语及BERT模型的空白。我们提出了一个新颖的多语言基准数据集IndicSentEval，并分析了9个多语言变换模型在6种印度语言中的表现，发现专门针对印度语言的模型更好地捕捉语言特性，但在某些干扰下，通用模型表现出更好的鲁棒性。这些发现有助于优化与印度语言相关的自然语言处理任务。

Oct, 2024

多语种语言模型中句法知识的受控评估

本研究解决了低资源语言中语言模型对句法概括能力理解不足的问题，通过针对性句法评估测试，对巴斯克语、印地语和斯瓦希里语进行评估。研究发现，模型在某些句法任务上表现良好，而在其他任务（如巴斯克语中的间接宾语一致性）上则面临挑战，并揭示了现有转换模型的偏差和性能不足问题。

Nov, 2024