即时生成表格
该研究为电子表格程序配备了智能辅助功能,并聚焦于实体焦点表,介绍了填充行和填充列的两种特定任务,并开发了生成概率模型。经过实验评估,结果表明,该方法胜过文献中的现有方法。
Aug, 2017
地址 “临时表检索” 的问题,提出了一种通过语义匹配查询和表格的方法,通过在多个语义空间中表示查询和表格,并采用各种相似性度量将这些特征用于监督式学习模型中,针对维基百科表格集合进行了实验,并取得了显著和实质性的改进。
Feb, 2018
本文介绍了一种设计良好的结构化搜索引擎,它以每列的关键词描述为查询的关键词,并利用网络上的海量表格来回答查询,用图形化模型来映射多个表格,并基于句子共现、匹配和内容重叠来描述查询。实验结果表明,该引擎比基线 IR 方法有显著的提高。
Jun, 2012
为了弥补现有评估数据集的不足,本研究构建了一个更具挑战性的数据集,并引入了一种新颖的问题,用于解决实体链接任务,即对单元格中的命名实体进行识别。最后,我们提出了一个提示框架,以评估新开发的大型语言模型在这一新的表格解释任务上的表现。
Mar, 2024
通过考虑表 - 查询关联和表 - 表关联,我们提出了一种改进的表检索方法,能够准确回答开放域问题,并取得了 9.3% 的 F1 得分和 5.4% 的准确率提升。
Apr, 2024
这篇研究提出一种方法,通过挖掘网络表格中的信息来发现知识库中尚未链接的实体和关系,从而补充和完善知识库。研究结果表明,该方法有效提高了精度并保持回收率稳定。
Feb, 2020
本文提出一种基于自然语言摘要的表格信息检索方法,并利用一个新的以对话为导向、面向开放领域的表格摘要数据集来构建 SOTA 基线系统,并指出了未来研究方向和挑战。
May, 2020
本研究旨在解决自然语言处理中未结构化文本与半结构化表之间的关系问题,通过提出基于内容的表的检索方法,应用精心设计的特征和神经网络结构实现查找中最相关表格的目标,并发布了一个包含 21,113 个网络查询和 273,816 个表格的开放领域数据集,验证了该方法的有效性并提出了该任务的挑战。
Jun, 2017
本文提出了 ToolWriter 算法,针对 tabular question answering 中信息丢失问题,生成查询特定的程序并检测何时将它们应用于转换表格以与 TQA 模型的能力对齐。使用 ToolWriter 生成的行过滤器工具,提高了 WikiTableQuestions 和 WikiSQL 数据集的性能。同时揭示了结构化数据中潜在的程序化工具与神经元件相结合的潜力。
Mar, 2023
本文提出了一个基于表格和图像生成的任务来验证自然语言中获取的实体知识如何在视觉和语言模型中得以保留,其包括两部分,一是生成包含有关实体及相关图像的表格,二是基于实体及其知识表生成相关图像。我们使用英文维基百科文章的 170,000 个信息框创建了维基百科表格和图像生成 (WikiTIG) 数据集并使用 OFA 模型对任务进行了评估,实验结果表明,OFA 在预训练过程中会忘记其中一部分实体知识。
Jun, 2023