EMNLPOct, 2023

变压器语言模型中的结构概念是否普遍?迈向可解释的跨语言泛化

TL;DR利用语言的语法方面作为测试基础,我们的分析揭示了对于仅编码器和仅解码器的大型语言模型,语言的结构概念空间之间具有高度的对齐度。然后,我们提出了一种基于元学习的方法来学习不同语言之间的概念空间对齐,从而实现零样本学习和少样本学习,并增进了对跨语境情景的学习现象的理解。在语法分析任务上的实验表明,我们的方法与最先进的方法相比取得了竞争性的结果,并缩小了语言之间的性能差距,特别有助于那些资源有限的语言。