通过增加话语上下文和自适应分类阈值进行细粒度实体类型划分

Apr, 2018

通过增加话语上下文和自适应分类阈值进行细粒度实体类型划分

Fine-grained Entity Typing through Increased Discourse Context and Adaptive Classification Thresholds

Sheng Zhang, Kevin Duh, Benjamin Van Durme

TL;DR本文提出了一种神经架构模型，用于将 fine-grained 语义类型分配给实体提及，并学习利用比以前更多的语义上下文信息（文档和句子级别）的分布式语义表示。实验结果表明，该方法在三个基准数据集上取得了最先进的结果，而不需要手工特征。

Abstract

fine-grained entity typing is the task of assigning fine-grained semantic types to entity mentions. We propose a neural architecture which learns a →

fine-grained entity typing neural architecture distributional semantic representation adaptive classification thresholds state-of-the-art results

发现论文，激发创造

上下文相关的细粒度实体类型标记

这篇论文提出了一种上下文相关细粒度实体类型标注的方法，通过基于知识库提取实体和其类型，限制在本地上下文中可以推导的标签集，实验结果表明可以有效改善标注的精度。

Dec, 2014

实体链接技术优化细粒度实体类型划分

通过实体链接，结合上下文信息和查询结果，我们提出了一种深度神经模型，用于精细化实体类型分类。在两个数据集上的实验结果表明，相对当前最先进水平，我们的方法分别取得了超过 5％的绝对严格准确度提高。

Sep, 2019

为新 X (X = 语言、领域、风格) 迅速构建细粒度实体类型识别系统

本文提出了一种无监督实体类型框架，通过结合符号和分布语义，使用语言结构学习通用的嵌入，并开发了一种新型的联合层次聚类和链接算法来对所有提及进行类型。该框架不依赖于任何注释数据、预定义的打字架构或手工特征，因此可以快速适应新的领域、体裁和语言。同时，它具有很大的灵活性，可以包括语言结构等来改进特定上下文表示。

Mar, 2016

一种细粒度实体类型分类的注意力神经网络架构

本文提出了一种新颖的基于注意力机制的神经网络模型，用于精细分类实体类型，与以前的模型不同的是，我们的模型递归地构建实体提及上下文的表示。我们的模型在著名的 FIGER 数据集上实现了 74.94% 的松散微平均 F1 分数，相对提高了 2.59％。我们还研究了我们的模型中注意机制的行为，并观察到它可以学习表明实体精细类别成员资格的上下文语言表达式。

Apr, 2016

领域无关实体链接的细粒度实体类型划分

该论文介绍了一种可以构建鲁棒实体链接模型的方法，该方法将注意力放在建立细粒度实体属性的模型上，具有更好的泛化性能，使用维基百科类别的大型库存来远程标记数据并训练实体类型模型，使用软类型预测将提及链接到最相似的候选实体上。

Sep, 2019

细粒度实体类型分类的神经架构

本文采用几种神经网络结构进行细粒度实体类型分类研究，并考虑了对最近提出的注意力神经结构的扩展，得出了三个关键贡献：结合学习和手工特征，同时观察它们互补作用；定量分析表明该注意力机制能够学习关注句法头和包含提及的短语，在我们的任务中，这些都是强大的手工特征；通过分层标签编码方法实现参数共享，在低维投影中显示出每种类型层次的明显聚类；虽然使用相同的评估数据集，但文献经常比较使用不同数据训练的模型，我们发现训练数据的选择对性能有显着影响，甚至会降低先前提出的方法的松散微 F1 得分高达 9.85％，但我们的最佳模型在广为人知的 FIGER（GOLD）数据集上实现了最新成果，松弛的微 F1 得分为 75.36％。

Jun, 2016

利用语境信息进行语料级细粒度实体类型划分

本研究基于嵌入式方法，提出了 FIGMENT 来解决语料库实体类型划分问题，并在知识库完成中应用。FIGMENT 由全局模型和上下文模型组成，分别得分后进行综合评分，其性能优于依赖于开放信息提取系统获取关系的实体类型划分方法。

Jun, 2016

超细粒度实体类型化

介绍了一种新的实体类型任务，使用头词来进行大规模远程监督，利用多任务目标训练模型，实现对实体类型的预测，对这一方法进行了实验评估并提供相关数据和模型。

Jul, 2018

使用 TypeNet 进行更细粒度的实体类型划分

介绍了 TypeNet 数据集，该数据集由 1941 个类型组成，通过人工注释从 1081 个 Freebase 类型映射到 WordNet。本文还探讨了几种与先进系统可比的模型，以及在标准提及类型损失的基础上结合层次结构损失的技术，是未来研究的第一步。

Nov, 2017

语料库级细粒度实体类型标注

本文提出 FIGMENT 模型解决了基于语料库的实体类型问题。该模型使用多层次的实体表示和远程监督的噪声缓解算法，实现了知识库完成的任务。在基于 Freebase 的大型实体类型数据集中，该模型表现出很好的效果。

Aug, 2017