May, 2023

StructGPT: 大型语言模型推理结构化数据的通用框架

TL;DR本文研究如何以统一的方式提高大型语言模型在结构化数据上的零-shot推理能力。作者基于工具增强的研究开发了一种名为StructGPT的迭代阅读-推理方法,通过构建收集相关证据的专门函数以及使用外部接口效仿并线性化生成推理,逐步靠近所给定查询的目标答案。对三种类型的结构化数据进行的大量实验表明,该方法能显著提高ChatGPT的表现,并达到与完整数据监督调整基线相当的表现水平。