Oct, 2021
Masader: 面向阿拉伯文本和语音数据资源的元数据采集
Masader: Metadata Sourcing for Arabic Text and Speech Data Resources
Zaid Alyafeai, Maraim Masoud, Mustafa Ghaleb, Maged S. Al-shaibani
TL;DR该论文描述了最近几年自然语言处理管道的进展,重点介绍了由 200 个数据集构成的阿拉伯语 NLP 数据集最大的公共目录 Masader,以及为其他语言开发的元数据注释策略。