May, 2023

LLM 是否可以作为数据库接口?一种基于大规模数据库的文本到 SQL 的 BIg Bench

TL;DR本文提出了一个名为 Bird 的大规模基准数据集,旨在填补现有基准测试数据集在数据库值、外部知识和 SQL 某些方面的不足。实验结果表明,在大型数据库的文本到 SQL 转换中,数据库值具有重要意义。同时,最先进的文本到 SQL 模型 ChatGPT,转换准确度仅为 40.08%,距离人类结果 92.96% 还有巨大的差距。