利用表格和文本进行问答的表征
该论文研究了开放式问答系统(QA)在同时检索结构化表格和非结构化文本数据时的困难之处,并提出了两种新技术以提高检索准确率,让模型的精确匹配得分提高至 27% 以上,这为该领域的未来研究提供了重要的参考价值。
Oct, 2020
本研究提出了一种简单而有效的方法,用于在给定的表格中集成外部信息,通过构建一个包含缺失信息的增强表格,然后生成两个表格的 SQL 查询来回答问题。实验证明,我们的方法在三个表格问答基准测试上优于强基准模型。
Jan, 2024
该研究调查了目前表格问答的数据集和方法,并将现有的表格问答方法分类为五类,即基于语义解析的、生成式的、提取式的、基于匹配的和检索式的方法。此外,研究还提出了该领域的一些主要挑战和未来方向。
Jul, 2022
本研究旨在解决自然语言处理中未结构化文本与半结构化表之间的关系问题,通过提出基于内容的表的检索方法,应用精心设计的特征和神经网络结构实现查找中最相关表格的目标,并发布了一个包含 21,113 个网络查询和 273,816 个表格的开放领域数据集,验证了该方法的有效性并提出了该任务的挑战。
Jun, 2017
通过比较分析不同 Table-to-Text 方法生成的语料库对 QA 系统性能的影响,为开发稳健 QA 系统的学术和工业界提供有价值的参考。
Feb, 2024
本文提出了一种处理同时在文本和表格中找到答案的问答模型,使用多模态数据集及向量嵌入模型进一步提高检索性能,其中 tri-encoders 模型的检索性能较 bi-encoders 模型更佳。
Aug, 2021
本文通过研究表格自然语言推理问题,针对文本的预训练上下文嵌入等现代自然语言处理方法在表格信息方面所面临的独特挑战,提出了有效的信息呈现改进,经过系统实验表明这些方法可以大幅提高模型的表格推理性能。
Apr, 2021
介绍了一种新的流程 TabIQA,它使用最先进的深度学习技术从图像中提取表格内容和结构信息,能够回答与数字数据、文本信息和结构化表格相关的各种问题,并且在回答与表格相关的问题方面取得了良好的成绩。
Mar, 2023