NormTab:通过表格数据规范化改进 LLMs 中的符号推理
通过对大型语言模型的研究,揭示了它们在解释和推理表格数据方面的能力,发现表格结构变化对模型性能的影响,提出了表格结构归一化的方法,并且比较了文本推理和符号推理,同时通过多个推理路径的聚合,取得了在 WIKITABLEQUESTIONS 任务上的最新成果。
Dec, 2023
TabSQLify 是一种新颖的方法,通过利用文本转 SQL 生成将表格分解为较小且相关的子表,仅包含回答问题或验证陈述所需的基本信息,然后执行推理任务。在对四个具有挑战性的数据集进行全面评估的情况下,我们的方法展现出与依赖完整表格作为输入的流行方法相当或更好的性能。此外,我们的方法可以显著减少输入上下文的长度,使其在大规模表格推理应用中更具可扩展性和高效性。
Apr, 2024
TableLLM 是一个具有 130 亿参数的强大的大型语言模型,专门用于高效处理嵌入在文件或电子表格中的表格数据操作任务,适用于实际的办公场景。我们提出了一种远程监督方法用于训练,包括推理过程扩展策略,有效帮助训练语言模型理解推理模式,以及交叉验证策略,确保自动生成的数据的质量。通过自行构建的评估管道和基准测试来评估 TableLLM 的性能,可以处理文件和电子表格格式,并突出显示了 TableLLM 与各种现有的通用型和面向表格数据的语言模型相比的优势。我们已公开发布了模型检查点、源代码、基准测试和用于用户交互的网络应用程序。
Mar, 2024
提出了 OpenTab,一个开放域表格推理框架,利用大型语言模型(LLMs)通过表格检索器获取相关表格,并生成 SQL 程序来高效解析检索到的表格,从而实现了准确的响应,实验证明 OpenTab 在开放和封闭领域的设置中显著优于基线方法,达到了高达 21.5% 的更高准确性。
Feb, 2024
使用大型语言模型 (LLMs) 改善表格推理性能是当前主流方法。本文分析了在 LLMs 时代中提升表格推理性能的主要技术以及 LLMs 相较于之前方法的优势,并提供了改进现有方法和扩展实际应用的研究方向,以激发未来表格推理研究的进一步发展。
Feb, 2024
为了弥补现有评估数据集的不足,本研究构建了一个更具挑战性的数据集,并引入了一种新颖的问题,用于解决实体链接任务,即对单元格中的命名实体进行识别。最后,我们提出了一个提示框架,以评估新开发的大型语言模型在这一新的表格解释任务上的表现。
Mar, 2024
通过使用大型语言模型(LLMs)和 TAP4LLM 表格提供程序,我们在各种表格任务中实现了有效的半结构化数据推理,包括将原始表格分解为子表、提取语义和统计元数据、从可信知识源检索相关知识以及为 LLMs 推理打包采样表格。TAP4LLM 的不同组件作为插件,增强了 LLMs 对多样化表格任务中结构化数据的理解。
Dec, 2023
通过对大型语言模型(LLMs)在表格任务方面的应用进行全面的概述,本文除了涵盖传统的表格问答(Table QA)和事实验证等领域,还强调了表格操作和高级表格数据分析等新方面,并介绍了 LLMs 中的指导调优、提示和基于代理的方法,同时也提出了私有部署、高效推理和开发广泛基准的相关挑战。
Feb, 2024
利用大型语言模型(LLMs)在表格数据分类中的整合进行了研究,并引入三种新的序列化技术,包括显著的 LaTeX 序列化方法。该方法显著提升了 LLMs 在处理领域特定数据集方面的性能,具有内存效率和充分利用复杂数据结构的能力,并通过包括特征组合和重要性在内的广泛实验,证明了我们工作在准确性和效率方面的优越性。
Dec, 2023