NormTab：通过表格数据规范化改进 LLMs 中的符号推理

Jun, 2024

NormTab：通过表格数据规范化改进 LLMs 中的符号推理

NormTab: Improving Symbolic Reasoning in LLMs Through Tabular Data Normalization

Md Mahadi Hasan Nahid, Davood Rafiei

TL;DR该研究介绍了一种名为 NormTab 的新型框架，旨在通过规范化网页表格来提高大型语言模型在符号推理任务中的性能。实验证明，利用 NormTab 显著提高了符号推理性能，为增强基于大型语言模型的符号推理任务的重要性和有效性提供了充分的证据。

Abstract

In recent years, large language models (LLMs) have demonstrated remarkable capabilities in parsing textual data and generating code. However, their performance in tasks involving tabular data, especially those requiring

large language models symbolic reasoning web tables table normalization normtab

发现论文，激发创造

用大型语言模型重新思考表格数据理解

通过对大型语言模型的研究，揭示了它们在解释和推理表格数据方面的能力，发现表格结构变化对模型性能的影响，提出了表格结构归一化的方法，并且比较了文本推理和符号推理，同时通过多个推理路径的聚合，取得了在 WIKITABLEQUESTIONS 任务上的最新成果。

Dec, 2023

TabSQLify：通过表格分解提高 LLMs 的推理能力

TabSQLify 是一种新颖的方法，通过利用文本转 SQL 生成将表格分解为较小且相关的子表，仅包含回答问题或验证陈述所需的基本信息，然后执行推理任务。在对四个具有挑战性的数据集进行全面评估的情况下，我们的方法展现出与依赖完整表格作为输入的流行方法相当或更好的性能。此外，我们的方法可以显著减少输入上下文的长度，使其在大规模表格推理应用中更具可扩展性和高效性。

Apr, 2024

TableLLM：在真实办公场景中让 LLMs 能够操作表格数据

TableLLM 是一个具有 130 亿参数的强大的大型语言模型，专门用于高效处理嵌入在文件或电子表格中的表格数据操作任务，适用于实际的办公场景。我们提出了一种远程监督方法用于训练，包括推理过程扩展策略，有效帮助训练语言模型理解推理模式，以及交叉验证策略，确保自动生成的数据的质量。通过自行构建的评估管道和基准测试来评估 TableLLM 的性能，可以处理文件和电子表格格式，并突出显示了 TableLLM 与各种现有的通用型和面向表格数据的语言模型相比的优势。我们已公开发布了模型检查点、源代码、基准测试和用于用户交互的网络应用程序。

Mar, 2024

OpenTab: 推进作为开放域表格推理器的大型语言模型

提出了 OpenTab，一个开放域表格推理框架，利用大型语言模型（LLMs）通过表格检索器获取相关表格，并生成 SQL 程序来高效解析检索到的表格，从而实现了准确的响应，实验证明 OpenTab 在开放和封闭领域的设置中显著优于基线方法，达到了高达 21.5% 的更高准确性。

Feb, 2024

大型语言模型在表格推理中的调查

使用大型语言模型 (LLMs) 改善表格推理性能是当前主流方法。本文分析了在 LLMs 时代中提升表格推理性能的主要技术以及 LLMs 相较于之前方法的优势，并提供了改进现有方法和扩展实际应用的研究方向，以激发未来表格推理研究的进一步发展。

Feb, 2024

Wiki-TabNER：通过命名实体识别推进表格解释

为了弥补现有评估数据集的不足，本研究构建了一个更具挑战性的数据集，并引入了一种新颖的问题，用于解决实体链接任务，即对单元格中的命名实体进行识别。最后，我们提出了一个提示框架，以评估新开发的大型语言模型在这一新的表格解释任务上的表现。

Mar, 2024

TAP4LLM：针对大型语言模型推理的半结构化数据采样、增补和打包表格提供器

通过使用大型语言模型（LLMs）和 TAP4LLM 表格提供程序，我们在各种表格任务中实现了有效的半结构化数据推理，包括将原始表格分解为子表、提取语义和统计元数据、从可信知识源检索相关知识以及为 LLMs 推理打包采样表格。TAP4LLM 的不同组件作为插件，增强了 LLMs 对多样化表格任务中结构化数据的理解。

Dec, 2023

表格处理的大语言模型：调查报告

通过对大型语言模型（LLMs）在表格任务方面的应用进行全面的概述，本文除了涵盖传统的表格问答（Table QA）和事实验证等领域，还强调了表格操作和高级表格数据分析等新方面，并介绍了 LLMs 中的指导调优、提示和基于代理的方法，同时也提出了私有部署、高效推理和开发广泛基准的相关挑战。

Feb, 2024

LLMs 中的表格表示、噪声操作及其对表格结构理解任务的影响

通过引入基于自我监督任务的结构化任务集合以及噪声操作，本研究探讨大型语言模型在表格任务中的效能和结构理解能力。

Oct, 2023

为了提升少样本分类的表格数据序列化

利用大型语言模型（LLMs）在表格数据分类中的整合进行了研究，并引入三种新的序列化技术，包括显著的 LaTeX 序列化方法。该方法显著提升了 LLMs 在处理领域特定数据集方面的性能，具有内存效率和充分利用复杂数据结构的能力，并通过包括特征组合和重要性在内的广泛实验，证明了我们工作在准确性和效率方面的优越性。

Dec, 2023