用于网络问答的半结构化数据图形表示

COLINGOct, 2020

用于网络问答的半结构化数据图形表示

A Graph Representation of Semi-structured Data for Web Question Answering

Xingyao Zhang, Linjun Shou, Jian Pei, Ming Gong, Lijie Wen...

TL;DR本研究提出了一种基于图表示的网络数据表和列表的有效分类方法，通过预训练技术和推理技术来进行问答任务，显著提高了目前最先进技术的 F1 分数。

Abstract

The abundant semi-structured data on the Web, such as HTML-based tables and lists, provide commercial search engines a rich information source for question answering (QA). Different from plain text passages in Web documents, →

semi-structured data web tables question answering graph representation pre-training techniques

发现论文，激发创造

利用表格和文本进行问答的表征

本研究旨在通过利用文本周围信息来改进表格表示，从而提高全文问答效果，并在 Natural Questions 数据集上取得显著的改进。

Jan, 2021

半结构表上的组合语义分析

通过使用问题 - 答案对作为监督，本文在半结构化表格中回答复杂问题的新任务上同时提高了语义解析的知识源的广度和逻辑复合度的深度，提出了一种由强类型约束引导的逻辑形式驱动的解析算法，并创建了一个新的包含 22,033 个复杂问题的维基百科表格数据集进行了评估。

Aug, 2015

基于内容的 Web 查询表格检索

本研究旨在解决自然语言处理中未结构化文本与半结构化表之间的关系问题，通过提出基于内容的表的检索方法，应用精心设计的特征和神经网络结构实现查找中最相关表格的目标，并发布了一个包含 21,113 个网络查询和 273,816 个表格的开放领域数据集，验证了该方法的有效性并提出了该任务的挑战。

Jun, 2017

在无需逻辑形式的情况下回答结构化数据上的对话式问题

我们提出了一种用于回答基于结构化对象的时序问题的新方法，可以编码表格为图，使用指针网络从编码图中选择答案。我们展示了该方法在 SQA 任务上具有竞争性的结果。

Aug, 2019

基于语义结构的知识图谱问答查询图预测

本研究主要关注于如何从自然语言问题中构建查询图谱，提出了一种基于语义结构的 BERT 模型进行分析和预测，通过过滤噪声查询图，提高了问题解答的准确性。实验结果表明该方法比现有技术有更好的效果。

Apr, 2022

Doc2SoarGraph: 基于语义导向的分层图表集成模型在文本 - 表格视觉丰富文档的离散推理中的应用

本研究提出一种基于语义导向的分层图结构的 Doc2SoarGraph 框架，旨在通过利用问题和文档中不同元素（如数量、日期）之间的差异和相关性来增强离散推理能力，以回答视觉丰富的表文档中的问题。实验结果显示，我们的框架在 TAT-DQA 数据集上表现出优异的性能，相较于最佳基线模型，精确匹配和 F1 得分分别提高了 17.73% 和 16.91%，达到了最新的最佳水平。

May, 2023

利用列关键词回答网络表查询

本文介绍了一种设计良好的结构化搜索引擎，它以每列的关键词描述为查询的关键词，并利用网络上的海量表格来回答查询，用图形化模型来映射多个表格，并基于句子共现、匹配和内容重叠来描述查询。实验结果表明，该引擎比基线 IR 方法有显著的提高。

Jun, 2012

半结构化表格问答的神经多步推理

本文研究使用深度学习技术回答多步推理问题的方法，该方法基于自然语言问句生成机器可理解的逻辑形式，使用字符和单词 CNN 同时嵌入逻辑形式和问句，并使用神经评分函数检索问题的最可能逻辑形式，取得 38.7% 的最佳性能。

Feb, 2017

用于快速文本理解的结构化摘要生成

使用大型语言模型（LLMs）生成文本的结构化表示，通过提出有效的提示策略来解决当前模型在生成结构化输出方面的困难，并且通过使用表格和思维导图作为代表模态进行实证评估，结果表明与纯文本相比，使用表格和思维导图可以显著减少阅读理解时间而不会导致准确性降低。

Jan, 2024

基于图的问答系统

本文介绍了如何使用基于图形数据库的信息提取和检索系统以实现对大数据分析的自动化检索和快速文本分析。

Dec, 2018