Oct, 2022

通用且独立:多语言探测框架用于全面模型解释和评估

TL;DR本文提出并应用一种GUI辅助框架,使我们能够轻松地探寻普遍依赖数据中所有形态句法特征所出现的大量语言。我们发现,反映了过去几年自然语言处理的西方中心趋势,mBERT模型中揭示的大多数规律对于西欧语言而言是典型的。因此,我们提出了一个工具包,以系统化解决多语种模型中存在的缺陷,为104种语言和80种形态句法特征提供可重复的实验设置。