PTD-SQL：利用大语言模型进行文本到SQL的分区和目标钻探

Sep, 2024

PTD-SQL：利用大语言模型进行文本到SQL的分区和目标钻探

PTD-SQL: Partitioning and Targeted Drilling with LLMs in Text-to-SQL

Ruilin Luo, Liyuan Wang, Binghuai Lin, Zicheng Lin, Yujiu Yang

TL;DR本研究解决了大语言模型（LLMs）在文本到SQL任务中的推理能力提升这一问题，提出通过查询组分区的方式，使LLMs专注于单一问题类型的学习。研究表明，应用PTD-SQL的模型在Spider和BIRD数据集上的表现超越或匹敌之前的最新方法，特别是在模型的能力边界上实现了显著提升，显示出与人类学习进步的相似性。

Abstract

Large Language Models (LLMs) have emerged as powerful tools for Text-to-SQL tasks, exhibiting remarkable reasoning capabilities. Different from tasks such as math word problems and commonsense reasoning, SQL solu

发现论文，激发创造

DIN-SQL：基于上下文分解的自我修正文本到SQL学习

研究了如何将复杂的文本到SQL任务分解为较小的子任务，从而显著提高大型语言模型（LLMs）在推理过程中的性能，证明了将SQL查询分解为子问题并将这些子问题的解决方案提供给LLMs可以显著提高性能。在三个LLMs上的实验表明，此方法始终将性能提高约10％，推动LLMs的准确性接近最先进水平，甚至超过用于持有Spider数据集的大型精调模型。

Apr, 2023

基于大型语言模型的文本转SQL：基准评估

本文对大型语言模型（LLMs）在Text-to-SQL任务中的应用进行了研究，提出了一种新的集成解决方案DAIL-SQL，并通过实验证明了其在Spider排行榜上取得了86.6%的执行准确率。研究重点在于提示工程中的令牌效率和任务特定的监督微调。通过探索开源LLMs在Text-to-SQL中的潜力，以及任务特定的监督微调的优势和劣势，希望能够对LLMs在Text-to-SQL领域提供更深入的了解，并激发进一步的研究和广泛应用。

Aug, 2023

LLMs的有效表格推理能力提炼

本论文提出了一种新颖的基于表格推理的蒸馏方法，通过将大型语言模型（LLMs）蒸馏成专门为基于表格推理任务设计的小型模型，实验证明使用蒸馏数据进行微调的0.22亿参数模型（Flan-T5-base）在科学表格文本生成数据集（SciGen）上不仅显著提高了性能，而且超越了诸如gpt-3.5-turbo等特定LLMs的表现。

Sep, 2023

DIVKNOWQA: 通过知识库和文本进行开放领域问答评估LLM的推理能力

大型语言模型在生成能力方面表现出色，但当仅依赖其内部知识时，容易出现幻觉，尤其是在回答需要不太常见的信息的问题时。基于检索的大型语言模型已经成为将其与外部知识结合的潜在解决方案，然而，最近的方法主要强调从非结构化文本语料库进行检索，忽视了底层结构。此外，当前领域存在一个显著的差距，即缺乏对异构知识源（如知识库和文本）上的大型语言模型进行有效定位的实际基准数据集。为了填补这一空白，我们精心策划了一个综合数据集，提出了两个独特挑战：（1）需要从开放域结构化和非结构化的知识源中检索信息的两跳多源问题，正确回答问题需要从结构化知识源中检索信息；（2）符号化查询（例如用于Wikidata的SPARQL）的生成是一个关键要求，增加了额外的挑战。我们的数据集通过预定义的推理链自动生成和人工注释相结合的方式创建，我们还引入了一种新颖的方法，利用多个检索工具，包括文本段落检索和符号化语言辅助检索。我们的模型在解决上述推理挑战方面优于以往的方法。

Oct, 2023

评估具有数据库问答功能的LLM智能体中推理和行动的整合

本研究介绍了一个新的长格式数据库问答数据集，旨在评估大型语言模型（LLMs）与SQL解释器的互动。研究发现即使对于最先进的GPT-4模型，这个任务也存在巨大挑战。我们提出并评估了两种互动策略，并对互动过程中的各个阶段进行了细致分析。一个重要发现是确定了两个主要瓶颈，即规划能力和生成多个SQL查询能力。为了解决准确评估答案质量的挑战，我们引入了一个多代理评估框架，模拟学术同行评审过程，增强了我们评估的精确性和可靠性。该框架使我们能够更加细致地了解当前LLMs在复杂检索和推理任务中的优点和局限性。

Nov, 2023

大型语言模型的文本到SQL能力基准测试：全面评估

通过构建新数据集和提出五个评估任务，全面评估不同方法在文本到SQL过程中的性能，揭示了大型语言模型之间的性能差异，并提出了针对每个任务的最佳上下文学习解决方案，为改进基于大型语言模型的文本到SQL系统的开发提供了有价值的见解。

Mar, 2024

TACT: 提高复杂聚合推理的信息提取工具

使用TACT数据集评估了大型语言模型（LLMs）的推理和计算能力，发现现有模型在整合分散信息和执行复杂集成任务方面表现不佳。提出了一个名为IE作为工具的新建模型框架，通过为每个步骤添加工具并采用few-shot prompting方法，有效提升了模型在这些任务中的能力。

Jun, 2024

下一代数据库接口：LLM基于文本到SQL的调查

根据自然语言问题（文本到SQL）生成准确的SQL是一个长期存在的问题，传统的文本到SQL系统使用人工工程和深度神经网络，而最近的大型语言模型（LLMs）已经展示出在自然语言理解方面的显著能力，因此，将LLM-based实现整合到文本到SQL研究中可以带来独特的机遇、挑战和解决方案。

Jun, 2024

Lucy：思考和推理以解决文本到SQL

大型语言模型在自然语言数据库查询方面取得了显著的进展，但在大型企业数据库中的性能下降。我们分析了这些环境中LLMs面临的挑战，并提出了一种新的解决方案，将LLMs在理解问题方面的能力与自动推理技术相结合以处理复杂的数据库约束。基于这些思想，我们开发了一个新的框架，在复杂基准测试中的零-shot文本到SQL方面胜过了现有技术。

Jul, 2024

从自然语言到SQL：基于大型语言模型的文本转SQL系统评述

本研究解决了将自然语言查询转化为结构化SQL命令的持续问题，提供了基于大型语言模型的文本转SQL系统的全面演变分析。论文独特地探讨了知识图谱在提高语境准确性和模式链接中的作用，关键发现为当前技术的局限性及未来改进方向。

Oct, 2024