利用表格和文本进行问答的表征

ACLJan, 2021

Representations for Question Answering from Documents with Tables and Text

Vicky Zayats, Kristina Toutanova, Mari Ostendorf

TL;DR本研究旨在通过利用文本周围信息来改进表格表示，从而提高全文问答效果，并在 Natural Questions 数据集上取得显著的改进。

Abstract

tables in web documents are pervasive and can be directly used to answer many of the queries searched on the Web, motivating their integration in question answering. Very often information presented in

web documents tables question answering textual context natural questions dataset

发现论文，激发创造

表格与文本的开放式问题回答

该论文研究了开放式问答系统（QA）在同时检索结构化表格和非结构化文本数据时的困难之处，并提出了两种新技术以提高检索准确率，让模型的精确匹配得分提高至 27% 以上，这为该领域的未来研究提供了重要的参考价值。

Oct, 2020

用于网络问答的半结构化数据图形表示

本研究提出了一种基于图表示的网络数据表和列表的有效分类方法，通过预训练技术和推理技术来进行问答任务，显著提高了目前最先进技术的 F1 分数。

Oct, 2020

先增强后实践：通过表格扩展实现知识增强问答

本研究提出了一种简单而有效的方法，用于在给定的表格中集成外部信息，通过构建一个包含缺失信息的增强表格，然后生成两个表格的 SQL 查询来回答问题。实验证明，我们的方法在三个表格问答基准测试上优于强基准模型。

Jan, 2024

基于密集检索的表格开放领域问答

本研究针对开放领域问题回答系统的表格数据提出了一种有效的检索方法，并通过训练和挖掘难例等技术，提高了回答的准确性和表现。

Mar, 2021

表格问答调查：最新进展

该研究调查了目前表格问答的数据集和方法，并将现有的表格问答方法分类为五类，即基于语义解析的、生成式的、提取式的、基于匹配的和检索式的方法。此外，研究还提出了该领域的一些主要挑战和未来方向。

Jul, 2022

基于内容的 Web 查询表格检索

本研究旨在解决自然语言处理中未结构化文本与半结构化表之间的关系问题，通过提出基于内容的表的检索方法，应用精心设计的特征和神经网络结构实现查找中最相关表格的目标，并发布了一个包含 21,113 个网络查询和 273,816 个表格的开放领域数据集，验证了该方法的有效性并提出了该任务的挑战。

Jun, 2017

基于表格转文本方法探索在基于 LLM 的领域混合数据上增强问答效果的影响

通过比较分析不同 Table-to-Text 方法生成的语料库对 QA 系统性能的影响，为开发稳健 QA 系统的学术和工业界提供有价值的参考。

Feb, 2024

使用三元编码模型的多模态表格和文本检索

本文提出了一种处理同时在文本和表格中找到答案的问答模型，使用多模态数据集及向量嵌入模型进一步提高检索性能，其中 tri-encoders 模型的检索性能较 bi-encoders 模型更佳。

Aug, 2021

利用外部知识提升表格推理能力

本文通过研究表格自然语言推理问题，针对文本的预训练上下文嵌入等现代自然语言处理方法在表格信息方面所面临的独特挑战，提出了有效的信息呈现改进，经过系统实验表明这些方法可以大幅提高模型的表格推理性能。

Apr, 2021

TabIQA：企业文档图像中针对表格的问答

介绍了一种新的流程 TabIQA，它使用最先进的深度学习技术从图像中提取表格内容和结构信息，能够回答与数字数据、文本信息和结构化表格相关的各种问题，并且在回答与表格相关的问题方面取得了良好的成绩。

Mar, 2023