利用语义相似性进行 Ad Hoc 表格检索
本研究旨在解决自然语言处理中未结构化文本与半结构化表之间的关系问题,通过提出基于内容的表的检索方法,应用精心设计的特征和神经网络结构实现查找中最相关表格的目标,并发布了一个包含 21,113 个网络查询和 273,816 个表格的开放领域数据集,验证了该方法的有效性并提出了该任务的挑战。
Jun, 2017
本文介绍了一种设计良好的结构化搜索引擎,它以每列的关键词描述为查询的关键词,并利用网络上的海量表格来回答查询,用图形化模型来映射多个表格,并基于句子共现、匹配和内容重叠来描述查询。实验结果表明,该引擎比基线 IR 方法有显著的提高。
Jun, 2012
该研究提出了一种基于语义嵌入的高级匹配方法,通过利用用户搜索会话的语义嵌入来自动找到更多的相关查询以供广告商竞标,同时提出了解决冷启动问题的方法,该方法已在实际搜索流量中进行了测试并获得了显著的优化结果和增量收益,同时将学习到的查询嵌入开源供计算广告和相关领域的研究人员使用。
Jul, 2016
本研究采用深度学习方法,通过利用表格的上下文语义特征和知识库查询算法,实现了对没有元数据的表格的列类型预测,不仅在单独的表格集上表现良好,转移学习到其他表格集也有良好的性能。
May, 2019
通过考虑表 - 查询关联和表 - 表关联,我们提出了一种改进的表检索方法,能够准确回答开放域问题,并取得了 9.3% 的 F1 得分和 5.4% 的准确率提升。
Apr, 2024
通过使用问题 - 答案对作为监督,本文在半结构化表格中回答复杂问题的新任务上同时提高了语义解析的知识源的广度和逻辑复合度的深度,提出了一种由强类型约束引导的逻辑形式驱动的解析算法,并创建了一个新的包含 22,033 个复杂问题的维基百科表格数据集进行了评估。
Aug, 2015
本文提出一种基于自然语言摘要的表格信息检索方法,并利用一个新的以对话为导向、面向开放领域的表格摘要数据集来构建 SOTA 基线系统,并指出了未来研究方向和挑战。
May, 2020
本文提出一种知识感知型的语义解析模型,通过整合不同类型的知识,包括语法知识、专家知识和外部资源知识,提高了对表格的对话语义解析性能。实验结果表明,该模型优于现有最先进的方法,还证明了各种知识的有效性。
Sep, 2018