EMNLPOct, 2022

Bloom 图书馆:支持 300 多种语言的多模态数据集,可用于各种下游任务

TL;DRBloom Library 是一个多语言多模态数据集;其中含有 363 种语言,是目前包含语言最多的数据集之一,可用于低资源条件下的自然语言处理研究。