该研究提出了一种新的基于 ShadowGNN 的文本到 SQL 转化模型,通过抽象和语义级别处理数据库模式以提高模型对不常见和没有看到过的模式的泛化能力,并在 Text-to-SQL 基准测试中表现优异。
Apr, 2021
本文提出一种混合型框架,将文本和表格式证据作为输入,根据问题生成直接答案或 SQL 查询,并在几个开放领域问题回答(ODQA)数据集上表现出了明显优于基线模型的表现。在详细的分析中,证明生成结构化 SQL 查询将始终带来收益,尤其是对于那些需要复杂推理的问题。这是第一个将 Text2SQL 应用于 ODQA 任务的论文。
Aug, 2021
该论文通过设计一个简单而有效的数据增强框架,提出了一种层次化的 SQL 转自然语言问题生成模型,以及一种简单的采样策略来显著提高训练效率。在三个跨领域数据集上的实验表明,其方法可以一贯地改善表现,并且层次化生成组件是改善的关键。
Mar, 2021
本文讨论了文本到 SQL 任务的结构概括问题。通过研究现有数据集和实验结果,我们观察到了(自然语言,SQL)模式过分拟合的实践限制。
Jan, 2023
本研究提出了一个基于无监督领域自适应的节点分类方法,该方法利用了已经训练好的源模型,而不需要访问源图和其标签,实现了对无标签目标图的分类,实验结果表明该方法在四项跨领域任务中都获得了显著的改进。
Dec, 2021
该研究关注语言解析到 SQL 的过程,并提出了一种使用图神经网络对数据库模式进行编码的方法,在 Spider 数据集上得到了较高的解析准确率。
May, 2019
利用用户查询和数据库的结构信息改进结构化 SQL 的生成问题,提出了一种结构引导的 SQL(SGU-SQL)生成模型,并通过实验验证其优于 16 种 SQL 生成方法。
Feb, 2024
此篇论文主要针对大规模图形表示学习的高成本问题,提出了自适应视图图神经编码器(AVGE)以及结构感知的群体判别(SAGD)方法,通过这两个方法,能够将大规模数据集的训练和推理成本显著降低 250 倍,并且不会丧失下游任务性能。
Mar, 2023
本文提出了一种注入语法到问 - Schema 图编码器中用于 Text-to-SQL 解析器的方法 ——S$^2$SQL,它有效地利用了问题中的句法依赖信息来提高性能,并采用解耦约束来诱导多样化的关系边缘嵌入,实验结果在 Spider 和鲁棒性设置 Spider-Syn 上均表现优于所有现有方法,使性能在 Spider 排行榜上名列前茅。
Mar, 2022
本文提出了逻辑结构约束建模的方法,通过引入针对命题单元的蕴涵或矛盾关系而非实体关系的逻辑结构来解决基于逻辑推理的问题回答任务,使用基于语篇的图网络实现了逻辑图构建和逻辑特征学习,并将基础特征与高级逻辑特征相结合,实现文本编码器的答案预测,实验结果证明该方法在三个文本逻辑推理数据集上效果显著,并且具有未见过逻辑文本的普适性。
Jul, 2022