ACLMay, 2024

应用基于制图的新课程学习方法于 RoNLI:首个罗马尼亚自然语言推理语料库

TL;DR自然语言推理 (NLI) 是一个活跃研究的领域,通过识别句子对中所呈现的蕴涵关系来代表自然语言理解。本文提出了第一个罗马尼亚语 NLI 语料库(RoNLI),其中包括 58K 个通过远程监督获取的训练句子对,以及手动注释了正确标签的 6K 个验证和测试句子对。我们进行了一系列基于远程学习的多个机器学习方法的实验,从基于词嵌入的浅层模型到基于 Transformer 的神经网络,以确立一组有竞争力的基准模型。此外,我们通过采用基于数据制图的新的课程学习策略,改进了最佳模型。我们提供了数据集和用于重现基准模型的代码。