May, 2023

通过输入设计评估和增强大型语言模型在表格上的结构理解能力

TL;DR本文旨在通过设计一个基准来评估 LLMs 的结构理解能力,包括七个挑战不同的任务,使用 self-augmentation 方法来提高 LLMs 的表格任务表现,提高了 TabFact、HybridQA、SQA、Feverous 和 ToTTo 等表格任务的性能。