ACLMay, 2023

SETI: 文本推理的系统性评估

TL;DRSETI 是一个用于评估预训练语言模型(PLMs)在文本推理领域中系统能力的新型综合性基准。它提供了三种不同的 NLI 任务和相应的数据集来评估模型在推理过程中各种类型的系统性。