ACLJan, 2019

MOROCO:摩尔多瓦和罗马尼亚方言语料库

TL;DR介绍了 MOldavian 和 ROmanian 方言语料库(MOROCO),包含来自六个主题的 33564 个文本样本和用于分类任务的标签,使用基于字符串核的浅层方法和包含 Squeeze-and-Excitation 块的字符级卷积神经网络的深层方法进行实验和研究了最具有区分性的特征。