基于数据库的对话自然语言接口的高效部署
本研究提出了一种基于句子转换模型的新方法,从庞大数量的大型问答数据集中自动派生自然语言推理(NLI)数据集,并展示了其将多种问答数据集成功应用于自然语言推理数据集的能力,从而新派生出包含 50 万个以上 NLI 示例的免费数据集 (QA-NLI),展示了它呈现的推理现象的宽泛性。
Sep, 2018
我们开发了一个基于数据驱动方法的自然语言接口系统,其中包含了一个逐步查询推荐模块,帮助用户在探索大型复杂 SQL 数据库时进行更有效和系统化地数据分析过程。我们的用户研究表明,相比于没有推荐模块的基准系统,我们的系统可以帮助用户更加高效和系统化地进行数据分析。
Jan, 2022
使用自然语言处理和语义解析的方法,在数据库查询过程中引入智能化,以帮助商业用户能够直接查询数据库。同时增加了自动可视化框架使得产品可供商业使用。
Oct, 2022
本文研究了使用自然语言作为桥梁,通过有效访问数据库创建一个高效的文本到 SQL 模型,重点探讨了 24 个不同神经网络模型以及 11 个常用数据集的特点和局限性,最终讨论了 Text2SQL 技术在实现无缝数据查询方面的可能性。
Aug, 2022
自然语言处理引起了用户与表格数据交互方式的革命,通过更直观、基于语言的界面,从传统的查询语言和手动绘图转变。大语言模型(LLMs)如 ChatGPT 及其后续模型进一步推进了这一领域,为自然语言处理技术开辟了新的途径。本研究综述了面向表格数据查询与可视化的自然语言界面,该界面允许用户使用自然语言查询与数据进行交互。我们介绍了这些界面背后的基本概念和技术,特别关注实现自然语言到 SQL 查询或数据可视化命令的语义解析技术。接着,我们从数据集、方法论、评估指标和系统设计等角度探讨了文本到 SQL 和文本到可视化问题的最新进展。这包括深入研究了 LLMs 的影响,突出了它们的优势、限制和未来改进的潜力。通过本综述,我们旨在为对开发和应用大语言模型时代的数据交互自然语言界面感兴趣的研究人员和实践者提供一条路线图。
Oct, 2023
本研究提出一种算法,利用数据集转换技术从长的 Trivia 问题转化为类似于日常人类交流的较短问题的方式,自动生成自然问题(NQ)数据集中的问题,同时使用神经分类器检测并去除不合法的问题,从而生成高质量的数据集,提高了 QA 表现,该算法在低资源环境下使用,扩展了 QA 系统的规模,同时保持了训练数据的质量。
Oct, 2022
通过使用大型语言模型(LLMs),我们提出了一个框架,可以自动生成与产品有关的上下文、有用、可回答、流畅且多样化的问题,并建议这些问题给客户作为帮助和提示,从而实现更顺畅、更快速、减少对话开销和摩擦的购物体验。
May, 2024
本文提出了一种基于 SPARQL 查询的多语言语义 Web 知识库问答(QA)方法,能够查询多个知识库,可轻松移植到其他知识库和语言。通过对五个不同的知识库和五种语言的评估,证明了该方法的影响。
Mar, 2018
使用低代码平台中的自然语言(NL)和 SQL 查询数据,我们提出了一个流程,让开发人员能够以自然语言检索数据,并使用 NL 模型生成 SQL。通过与生产数据的反馈,我们验证了流程的有效性,并观察到采用该流程后在四个不同模型中的特性采用率提高了 240%,参与率提高了 220%,失败率降低了 90%。
Aug, 2023