用于网络问答的半结构化数据图形表示
通过使用问题 - 答案对作为监督,本文在半结构化表格中回答复杂问题的新任务上同时提高了语义解析的知识源的广度和逻辑复合度的深度,提出了一种由强类型约束引导的逻辑形式驱动的解析算法,并创建了一个新的包含 22,033 个复杂问题的维基百科表格数据集进行了评估。
Aug, 2015
本研究旨在解决自然语言处理中未结构化文本与半结构化表之间的关系问题,通过提出基于内容的表的检索方法,应用精心设计的特征和神经网络结构实现查找中最相关表格的目标,并发布了一个包含 21,113 个网络查询和 273,816 个表格的开放领域数据集,验证了该方法的有效性并提出了该任务的挑战。
Jun, 2017
我们提出了一种用于回答基于结构化对象的时序问题的新方法,可以编码表格为图,使用指针网络从编码图中选择答案。我们展示了该方法在 SQA 任务上具有竞争性的结果。
Aug, 2019
本研究主要关注于如何从自然语言问题中构建查询图谱,提出了一种基于语义结构的 BERT 模型进行分析和预测,通过过滤噪声查询图,提高了问题解答的准确性。实验结果表明该方法比现有技术有更好的效果。
Apr, 2022
本研究提出一种基于语义导向的分层图结构的 Doc2SoarGraph 框架,旨在通过利用问题和文档中不同元素(如数量、日期)之间的差异和相关性来增强离散推理能力,以回答视觉丰富的表文档中的问题。实验结果显示,我们的框架在 TAT-DQA 数据集上表现出优异的性能,相较于最佳基线模型,精确匹配和 F1 得分分别提高了 17.73% 和 16.91%,达到了最新的最佳水平。
May, 2023
本文介绍了一种设计良好的结构化搜索引擎,它以每列的关键词描述为查询的关键词,并利用网络上的海量表格来回答查询,用图形化模型来映射多个表格,并基于句子共现、匹配和内容重叠来描述查询。实验结果表明,该引擎比基线 IR 方法有显著的提高。
Jun, 2012
本文研究使用深度学习技术回答多步推理问题的方法,该方法基于自然语言问句生成机器可理解的逻辑形式,使用字符和单词 CNN 同时嵌入逻辑形式和问句,并使用神经评分函数检索问题的最可能逻辑形式,取得 38.7% 的最佳性能。
Feb, 2017
使用大型语言模型(LLMs)生成文本的结构化表示,通过提出有效的提示策略来解决当前模型在生成结构化输出方面的困难,并且通过使用表格和思维导图作为代表模态进行实证评估,结果表明与纯文本相比,使用表格和思维导图可以显著减少阅读理解时间而不会导致准确性降低。
Jan, 2024