Nov, 2022

InDEX: 印度尼西亚成语和表达数据集的填空测试

TL;DR我们提出了InDEX,这是一个针对填空测试的印度尼西亚习语和表达数据集,其中包含10438个独特的句子,用于289个习语和表达式,我们生成了15种不同类型的干扰,从而形成了一个大型的填空式语料库。通过实验,发现将定义与随机初始化结合是增强基线模型并提高填空测试模型性能的更好方法。