Apr, 2022

多语言模型中的性别表征分析

TL;DR本文旨在研究多语言语言模型内部表征结构,以性别划分表示为实用案例,分析不同语言之间共享的子空间中性别概念的编码程度,发现共享的显著成分与语言特定成分并存,这解释了一个现象:尽管性别分类在不同语言之间转移表现良好,但在单一语言上训练的性别去除干预并不容易转移到其他语言。