EntiTables：面向实体的表格的智能辅助

SIGIRAug, 2017

EntiTables：面向实体的表格的智能辅助

EntiTables: Smart Assistance for Entity-Focused Tables

Shuo Zhang, Krisztian Balog

TL;DR该研究为电子表格程序配备了智能辅助功能，并聚焦于实体焦点表，介绍了填充行和填充列的两种特定任务，并开发了生成概率模型。经过实验评估，结果表明，该方法胜过文献中的现有方法。

Abstract

tables are among the most powerful and practical tools for organizing and working with data. Our motivation is to equip spreadsheet programs with smart assistance capabilities. We concentrate on one particular fa

spreadsheet programs tables generative probabilistic models entity focus knowledge base

发现论文，激发创造

即时生成表格

提出了一个基于特征的方法，通过生成关系表回答查询来更好地满足实体相关的信息需求，包括实体排名、架构决策和值查找等三个子任务并给出实现方法。

May, 2018

Table2Vec: 表格填充和检索的神经单词和实体嵌入

本文使用神经语言模型将表格数据嵌入向量空间，并将它们作为额外的语义相似性信号，应用于三种特定的表格相关任务：行填充、列填充和表检索。评估结果表明，表格嵌入可以显著提高现有基线模型的性能。

May, 2019

Wiki-TabNER：通过命名实体识别推进表格解释

为了弥补现有评估数据集的不足，本研究构建了一个更具挑战性的数据集，并引入了一种新颖的问题，用于解决实体链接任务，即对单元格中的命名实体进行识别。最后，我们提出了一个提示框架，以评估新开发的大型语言模型在这一新的表格解释任务上的表现。

Mar, 2024

科学文献表格实体链接实用系统

本文介绍了一个通用的实体链接系统，说明了如何将此系统适应域特定的实体，特别是那些内嵌在 COVID-19 相关科学文献中的实体。通过利用表格的结构和语义特征来提高整体实体链接性能，进一步推断科学表格的语义含义。

Jun, 2023

使用表格语言模型在工业表格中进行命名实体识别

本文研究如何将基于 transformer 的模型应用于工业级别的表格数据中的实体识别问题，并开发了一种专用的表格数据增强策略来提高性能，实验证明表格的归纳偏差对于 transformer-based 模型的收敛至关重要。

Sep, 2022

从 Web 表格中发现新实体

这篇研究提出一种方法，通过挖掘网络表格中的信息来发现知识库中尚未链接的实体和关系，从而补充和完善知识库。研究结果表明，该方法有效提高了精度并保持回收率稳定。

Feb, 2020

LaTable: 大型表格模型的探索

构建更好的零样本和少样本生成能力的生成式表格基础模型 LaTable 在有限样本的条件下，在实例内分布生成方面胜过基线，并在生成超出分布的数据集时表现更好。

Jun, 2024

表格数据中的实体链接需要正确的注意

本文研究如何将表格数据与知识库中的实体进行实体链接。通过引入一个名为 Tabular Entity Linking Lite (TELL) 的模型，可以在不依赖于查询目标知识库中事实的情况下，以常数内存使用量为代价获得与当今最先进的基于注意力机制的模型相当的结果。

Jul, 2022

自动表格：无需使用示例合成多步转换以在关系化表格中进行

Auto-Tables 系统使用多步转换（使用 Python 或其他语言）自动合成数据流水线，将非关系型表转化为标准关系形式，以满足下游分析的需求，无需用户手动编写转换程序。

Jul, 2023

增强表格推理的现实数据增强框架

该论文提出了一种实际的半自动数据增强框架，可以为半结构化表格推理等 NLI 任务构建训练数据。使用生成可应用于相似表格的假设模板生成假设并基于人类逻辑约束和前提重述创建有理的反事实表。该框架可以产生类人的表推理示例，可在有限监督的情况下提高训练数据的规模。

Oct, 2022