Oct, 2021

Masader: 面向阿拉伯文本和语音数据资源的元数据采集

TL;DR该论文描述了最近几年自然语言处理管道的进展,重点介绍了由 200 个数据集构成的阿拉伯语 NLP 数据集最大的公共目录 Masader,以及为其他语言开发的元数据注释策略。