COLINGNov, 2020

IndoLEM 和 IndoBERT: 印尼 NLP 的基准数据集和预训练语言模型

TL;DR发布了包括七个任务的 IndoLEM 数据集,以及新的预训练语言模型 IndoBERT 用于印度尼西亚语言,并在 IndoLEM 上进行了评估和与现有资源进行了基准测试。实验结果表明,IndoBERT 在 IndoLEM 的大部分任务上实现了最先进的性能。