Sep, 2018

如果我们简单地交换两个文本片段会怎样?一种直接而有效的方法来测试自然语言推理任务中方法对混淆信号的稳健性

TL;DR本研究探讨 NLI 数据集的统计异常现象(即混淆因素),使用一种简单而有效的方式通过交换文本片段来评估 NLI 预测模型,并提出使用模型在不同比例的交换文本片段下的评估表现偏差来描述预测模型的健壮性。