Oct, 2024

基于变换器的语言模型在描述逻辑ALCQ中的推理能力

TL;DR本研究针对现有评估基于变换器的语言模型的逻辑推理能力方法过于简单的问题,通过构建包含384,000个示例的自然语言数据集DELTA$_D$,在推理深度和语言复杂性上进行扩展。研究表明,经过我们的数据集微调的DeBERTa模型在蕴涵检查任务中表现出色,而GPT系列模型在少量样本下也能显著提升表现,展示了新的推理能力。