COLINGMar, 2024

MaiBaam:一个多方言的巴伐利亚通用依存树库

TL;DR我们提出了第一个多方言巴伐利亚树库(MaiBaam),通过 UD 手动标注了词性和句法依赖信息,涵盖多个文本流派,突出了巴伐利亚语和德语之间的形态句法差异,并展示了说话者拼写的丰富变化。我们的语料库包括 15k 个标记,涵盖了三个国家 Bavarian-speaking 区域的方言。我们提供了基准解析和词性标注结果,并公开了我们的数据集、语言特定的指南和代码,以支持进一步的巴伐利亚语法研究。