ACLJun, 2019

ChID: 一份大规模的中文成语完形填空数据集

TL;DR本文提出了一个大规模的中文填空测试数据集 ChID,用于研究汉语特有的习语理解,该数据集以候选成语替换文章中的成语,考察了候选成语的设计和成语表示对最先进模型的成绩表现的影响,结果显示机器准确率明显低于人类准确率,为今后的进一步研究留下了许多空间。