Aug, 2022

评估零样本通识推理的置信度而非困惑度

TL;DR本文提出一种新的通识推理度量标准 ——Non-Replacement Confidence (NRC),通过 Replaced Token Detection (RTD) 预训练目标在 PLMs 上进行推理,提高了两个通识推理基准数据集和七个通识问题回答数据集的零 - shot 表现。