提出了一个基于特征的方法,通过生成关系表回答查询来更好地满足实体相关的信息需求,包括实体排名、架构决策和值查找等三个子任务并给出实现方法。
May, 2018
本文使用神经语言模型将表格数据嵌入向量空间,并将它们作为额外的语义相似性信号,应用于三种特定的表格相关任务:行填充、列填充和表检索。评估结果表明,表格嵌入可以显著提高现有基线模型的性能。
May, 2019
为了弥补现有评估数据集的不足,本研究构建了一个更具挑战性的数据集,并引入了一种新颖的问题,用于解决实体链接任务,即对单元格中的命名实体进行识别。最后,我们提出了一个提示框架,以评估新开发的大型语言模型在这一新的表格解释任务上的表现。
Mar, 2024
本文介绍了一个通用的实体链接系统,说明了如何将此系统适应域特定的实体,特别是那些内嵌在 COVID-19 相关科学文献中的实体。通过利用表格的结构和语义特征来提高整体实体链接性能,进一步推断科学表格的语义含义。
Jun, 2023
本文研究如何将基于 transformer 的模型应用于工业级别的表格数据中的实体识别问题,并开发了一种专用的表格数据增强策略来提高性能,实验证明表格的归纳偏差对于 transformer-based 模型的收敛至关重要。
Sep, 2022
这篇研究提出一种方法,通过挖掘网络表格中的信息来发现知识库中尚未链接的实体和关系,从而补充和完善知识库。研究结果表明,该方法有效提高了精度并保持回收率稳定。
Feb, 2020
构建更好的零样本和少样本生成能力的生成式表格基础模型 LaTable 在有限样本的条件下,在实例内分布生成方面胜过基线,并在生成超出分布的数据集时表现更好。
Jun, 2024
本文研究如何将表格数据与知识库中的实体进行实体链接。通过引入一个名为 Tabular Entity Linking Lite (TELL) 的模型,可以在不依赖于查询目标知识库中事实的情况下,以常数内存使用量为代价获得与当今最先进的基于注意力机制的模型相当的结果。
Jul, 2022
Auto-Tables 系统使用多步转换(使用 Python 或其他语言)自动合成数据流水线,将非关系型表转化为标准关系形式,以满足下游分析的需求,无需用户手动编写转换程序。
Jul, 2023
该论文提出了一种实际的半自动数据增强框架,可以为半结构化表格推理等 NLI 任务构建训练数据。使用生成可应用于相似表格的假设模板生成假设并基于人类逻辑约束和前提重述创建有理的反事实表。该框架可以产生类人的表推理示例,可在有限监督的情况下提高训练数据的规模。
Oct, 2022