Jun, 2024

Qabas: 一个开源的阿拉伯语词典数据库

TL;DR我们介绍了 Qabas,这是一个新颖的开源阿拉伯词典,用于自然语言处理应用。Qabas 综合了 110 个词典,将词条通过链接的方式组合在一起,并且还与 12 个形态标注的语料库链接,使其成为首个与词典和语料库进行链接的阿拉伯词典。Qabas 是通过半自动化方式开发的,利用了一个映射框架和一个基于 Web 的工具。与其他词典相比,Qabas 是最全面的阿拉伯词典之一,包括约 58,000 个词条(45,000 个名词词条,12,500 个动词词条和 473 个功能词词条)。Qabas 是开源的,可以在网上访问。