使用 SQL 查询大型语言模型
根据自然语言问题(文本到 SQL)生成准确的 SQL 是一个长期存在的问题,传统的文本到 SQL 系统使用人工工程和深度神经网络,而最近的大型语言模型(LLMs)已经展示出在自然语言理解方面的显著能力,因此,将 LLM-based 实现整合到文本到 SQL 研究中可以带来独特的机遇、挑战和解决方案。
Jun, 2024
评估了大型语言模型(LLMs)在解释和执行自然语言查询与传统 SQL 时,在资源利用和准确性方面的表现,结果显示使用 LLMs 进行数据库查询会导致显著的能源开销,不建议用 LLMs 替代关系数据库。
Apr, 2024
本文对大型语言模型(LLMs)在 Text-to-SQL 任务中的应用进行了研究,提出了一种新的集成解决方案 DAIL-SQL,并通过实验证明了其在 Spider 排行榜上取得了 86.6% 的执行准确率。研究重点在于提示工程中的令牌效率和任务特定的监督微调。通过探索开源 LLMs 在 Text-to-SQL 中的潜力,以及任务特定的监督微调的优势和劣势,希望能够对 LLMs 在 Text-to-SQL 领域提供更深入的了解,并激发进一步的研究和广泛应用。
Aug, 2023
利用大型语言模型(LLMs)将自然语言问题转化为 SQL 查询(文本到 SQL)是一种有前途但具有挑战性的方法,特别是在应用于具有复杂和庞大模式的现实世界数据库时。我们提出了一个新的流程来解决这个问题,该流程有效地检索相关数据和上下文,选择一个高效的模式,并合成正确高效的 SQL 查询。
May, 2024
研究表明,通过任务分解可以大大提高大型语言模型在数据库理解和查询生成方面的能力,从而通过 SQL 查询回答人类问题。我们提出了一个新的框架,通过将架构划分为块来在有限的上下文中容纳更多信息,该方法的结果与 GPT-4 相当,但体积更小、速度更快并且成本更低。
Jan, 2024
使用 ChatGPT 创建自我指导的领域特定自然语言 - 图查询数据对以及使用这些数据对大型语言模型进行微调,并提出了一种提取相关模式的方法来引导模型生成准确的图查询语言(GQL)。实验证明,该方法在金融领域和医学领域的图数据库上取得了显著的性能改进。
Feb, 2024
该研究通过使用大型语言模型(LLMs)来进行文本到 SQL 程序合成的各种方法以及相关的结果和见解,通过使用流行的 Text-to-SQL 数据集(spider)输入自然语言问题和数据库模式并生成正确的 SQL SELECT 查询。通过细调 WizardLM 的 WizardCoder-15B 模型和 fine-tuning gpt-3.5-turbo-16k(Few-shot)+ gpt-4-turbo(Zero-shot error correction)的方式,查询的执行准确率达到了较高的 82.1%。大部分错误查询可以归为七个不同的类别,这揭示了 LLM 程序合成的瑕疵以及可改进的方向。
Jan, 2024
本文探讨了如何优化在关系查询中调用大型语言模型的 LLM 推断,包括重排行以最大化 LLM 推断引擎内的键值(KV)缓存重用,重排列列以进一步增加缓存重用,并去重复冗余的推断请求。我们在 Apache Spark 中实现了这些优化,在真实数据集上的多样化 LLM 查询基准测试中,最终端到端延迟提高了 4.4 倍。据我们所知,这是第一个明确解决在 SQL 查询中优化 LLM 调用问题的研究。
Mar, 2024
本研究提出了一种基于大型语言模型的 Text-to-SQL 模型 SQL-PaLM,该模型在几种不同的任务测试中都取得了最优结果,并展示了其应用于现实场景的鲁棒性和智能能力。
May, 2023
本研究介绍了一个新的长格式数据库问答数据集,旨在评估大型语言模型(LLMs)与 SQL 解释器的互动。研究发现即使对于最先进的 GPT-4 模型,这个任务也存在巨大挑战。我们提出并评估了两种互动策略,并对互动过程中的各个阶段进行了细致分析。一个重要发现是确定了两个主要瓶颈,即规划能力和生成多个 SQL 查询能力。为了解决准确评估答案质量的挑战,我们引入了一个多代理评估框架,模拟学术同行评审过程,增强了我们评估的精确性和可靠性。该框架使我们能够更加细致地了解当前 LLMs 在复杂检索和推理任务中的优点和局限性。
Nov, 2023