利用外部知识提升表格推理能力

ACLApr, 2021

Incorporating External Knowledge to Enhance Tabular Reasoning

J. Neeraja, Vivek Gupta, Vivek Srikumar

TL;DR本文通过研究表格自然语言推理问题，针对文本的预训练上下文嵌入等现代自然语言处理方法在表格信息方面所面临的独特挑战，提出了有效的信息呈现改进，经过系统实验表明这些方法可以大幅提高模型的表格推理性能。

Abstract

Reasoning about tabular information presents unique challenges to modern nlp approaches which largely rely on pre-trained contextualized embeddin

发现论文，激发创造

该论文提出了一种实际的半自动数据增强框架，可以为半结构化表格推理等 NLI 任务构建训练数据。使用生成可应用于相似表格的假设模板生成假设并基于人类逻辑约束和前提重述创建有理的反事实表。该框架可以产生类人的表推理示例，可在有限监督的情况下提高训练数据的规模。

Oct, 2022

本文采用 Pattern-Exploiting Training 技术对预训练语言模型进行强化，在知识事实和表格推理方面优于当前基准，且更有效地支持信息选项卡的底层推理任务，且该模型对各种字符和单词级扰动具有鲁棒性。

Oct, 2022

本文介绍了一个名为 INFOTABS 的新数据集，它由基于来自维基百科信息框的表格的前提条件的人工编写的文本假设组成。该研究表明，尽管人类标注者同意表格 - 假设对之间的关系，但是多个标准建模策略在此任务中效果不佳，表明表格推理可能会带来困难的建模挑战。

May, 2020

本研究提出一种半自动化框架，使用现有的表格数据重新解构，构建表格自然语言推理实例，以提高性能，分析零样本情况下在不同重新解构数据集类型的表现趋势。

Nov, 2022

本文研究如何将基于 transformer 的模型应用于工业级别的表格数据中的实体识别问题，并开发了一种专用的表格数据增强策略来提高性能，实验证明表格的归纳偏差对于 transformer-based 模型的收敛至关重要。

Sep, 2022

本研究旨在通过利用文本周围信息来改进表格表示，从而提高全文问答效果，并在 Natural Questions 数据集上取得显著的改进。

Jan, 2021

本文研究在于如何用外部的知识来丰富神经网络的自然语言推理模型，并展示了这些模型如何在 SNLI 和 MultiNLI 数据集上实现最先进的性能水平。

Nov, 2017

通过引入半结构化表中的时间问题回答任务，并使用 TempTabQA 数据集评估现有模型的时间推理能力，我们观察到即使是表现最好的 LLMs 在 F1 得分上也比人类表现差 13.5 个百分点以上，因此我们的数据集有潜力成为改进 NLP 模型时间推理能力的具有挑战性的基准。

Nov, 2023

本文提出了一种运用知识图谱的结合方法来提高自然语言推理问题（NLI）领域中性能的技术，该技术在文本、图形和文本到图形的模型上均取得了最新的最优表现，并讨论了外部知识在解决 NLI 问题中的实际意义。

Sep, 2018

本文提出一种知识感知型的语义解析模型，通过整合不同类型的知识，包括语法知识、专家知识和外部资源知识，提高了对表格的对话语义解析性能。实验结果表明，该模型优于现有最先进的方法，还证明了各种知识的有效性。

Sep, 2018