TableGPT:将表格、自然语言和指令统一为一体的 GPT 模型
语言模型(如 GPT-3.5 和 ChatGPT)在执行各种任务和遵循多样化人类指令方面表现出卓越能力;然而,通过使用一系列基础的表格理解任务进行分析,我们发现当今的语言模型在许多与表格相关的任务上仍不完善,这可能是因为它们主要是在 “一维” 的自然语言文本上预训练的,而监管表格是 “二维” 的对象。因此,我们提出了一种新的 “表格调优” 范式,在这个范式中,我们通过使用合成自真实表格的多样化表格任务作为训练数据,继续训练 / 微调 GPT-3.5 和 ChatGPT 这类语言模型,以增强其理解表格和执行表格任务的能力。我们的实验结果表明,我们的 Table-GPT 模型在广泛的表格任务上始终优于普通 GPT-3.5 和 ChatGPT,并且在包括未见过的任务在内的情况下,它具有强大的泛化能力,可以以与 GPT-3.5 和 ChatGPT 类似的方式响应各种人类指令执行新的表格任务。
Oct, 2023
DB-GPT 是一款现成的 Python 库,将大型语言模型(LLMs)与传统数据交互任务相结合,以增强用户体验和可访问性。它支持各种环境部署,并能够处理包括基本的文本到 SQL 转换以及生成式数据分析等复杂任务。此外,DB-GPT 还提供一系列产品功能,以方便用户将其集成到产品环境中。
Apr, 2024
通过评估四个最先进的大语言模型在生成结构化数据表方面的能力,本研究发现大语言模型在表格生成方面仍然存在挑战,GPT-4 的准确率最高为 19.6%。同时,研究还揭示了表格的各种属性(如大小、受欢迎程度和数值内容)如何影响生成性能,从而为未来研究提供了坚实的评估框架。
Jun, 2024
本文中,我们提出了在复杂表格问答中引入 GPT-3.5 的方法来解决相关挑战,通过重构复杂表格为元组并使用特定的提示设计对话框,将每个单元格的层次结构、位置信息和内容编码为一个元组,并通过加强提示模板的解释说明每个元组的含义和任务的逻辑推理过程,有效提高了 GPT-3.5 对复杂表格的层次结构感知能力,从而更好地解析复杂表格。通过大量的实验证明,我们的方法在复杂表格问答数据集 HiTAB 和航空领域数据集 AIT-QA 上显著优于先前的工作,取得了最先进的性能。
Dec, 2023
KG-GPT 是一个多功能框架,利用大型语言模型(LLMs)进行知识图谱(KGs)相关任务的复杂推理,将句子分割、检索相关图谱组件和推导逻辑结论分为三个步骤。我们通过使用基于 KG 的事实验证和 KGQA 基准来评估 KG-GPT,发现该模型表现出竞争力和稳健性,甚至胜过几个完全监督的模型。因此,我们的工作在统一 LLMs 的结构化和非结构化数据处理方面迈出了重要的一步。
Oct, 2023
利用 MaTableGPT 从材料科学文献中高效提取表格数据,成功实现了 96.8% 的提取准确率,并展示了几乎无错误的学习方法的成本分析和 Pareto 前沿映射,为水分解催化领域的研究提供了宝贵的洞察。
Jun, 2024
通过使用 Large Language Models (LLMs),我们提出了 ModelGPT 框架,以满足用户的特定需求,并以更快的速度生成定制化的 AI 模型,以实现更加便利和用户友好的人工智能模型。
Feb, 2024
自然语言处理引起了用户与表格数据交互方式的革命,通过更直观、基于语言的界面,从传统的查询语言和手动绘图转变。大语言模型(LLMs)如 ChatGPT 及其后续模型进一步推进了这一领域,为自然语言处理技术开辟了新的途径。本研究综述了面向表格数据查询与可视化的自然语言界面,该界面允许用户使用自然语言查询与数据进行交互。我们介绍了这些界面背后的基本概念和技术,特别关注实现自然语言到 SQL 查询或数据可视化命令的语义解析技术。接着,我们从数据集、方法论、评估指标和系统设计等角度探讨了文本到 SQL 和文本到可视化问题的最新进展。这包括深入研究了 LLMs 的影响,突出了它们的优势、限制和未来改进的潜力。通过本综述,我们旨在为对开发和应用大语言模型时代的数据交互自然语言界面感兴趣的研究人员和实践者提供一条路线图。
Oct, 2023
通过对大型语言模型(LLMs)在表格任务方面的应用进行全面的概述,本文除了涵盖传统的表格问答(Table QA)和事实验证等领域,还强调了表格操作和高级表格数据分析等新方面,并介绍了 LLMs 中的指导调优、提示和基于代理的方法,同时也提出了私有部署、高效推理和开发广泛基准的相关挑战。
Feb, 2024