BriefGPT.xyz
May, 2022
多语言语言模型表示的几何学
The Geometry of Multilingual Language Model Representations
HTML
PDF
Tyler A. Chang, Zhuowen Tu, Benjamin K. Bergen
TL;DR
本文使用XLM-R为案例研究,研究了多语言语言模型如何在维持共享多语言表示空间同时在每种语言中编码语言敏感信息,并证明了多语言语言模型沿着语言敏感和语言中性轴编码信息,使其能够提取下游任务和跨语言传递学习的各种特征。
Abstract
We assess how
multilingual language models
maintain a shared multilingual
representation space
while still encoding
language-sensitive informatio
→