May, 2023

使用微调和上下文学习评估语言模型中的否定推理能力

TL;DR本文介绍了 Scoped Negation NLI 基准测试,用于评估自然语言模型处理否定语义组合的能力,其中用到了一系列例子和策略,最后发现 InstructGPT 模型在句子补全测试中表现出了正确的否定语义推理能力,但在处理预训练体系外的样例时表现无法胜任。