Oct, 2023

中文字符级背包语言模型

TL;DR通过对字符分割的中文进行训练、评估、解释和控制,我们发现我们的(134M 参数)中文 Backpack 语言模型在性能上与(104M 参数)Transformer 相当,并且学习到了丰富的字符级意义,通过对数相加形成词汇的意义。在 SimLex 风格的词汇语义评估中,Backpack 字符意义的简单平均超越了 Transformer 的输入嵌入。我们发现,复杂的多字符意义通常通过在上下文中一致使用相同的字符意义权重来形成。通过控制来探索可解释性,我们发现我们可以将 Backpack 中的性别偏见定位到特定的字符意义并采取措施来减少偏见。