使用盒形嵌入模型精细建模实体类型

Jan, 2021

使用盒形嵌入模型精细建模实体类型

Modeling Fine-Grained Entity Types with Box Embeddings

Yasumasa Onoe, Michael Boratko, Greg Durrett

TL;DR本文研究使用盒子嵌入（box embeddings）模型来更好地捕捉细粒度实体类型之间的复杂相互依存关系，并与矢量嵌入模型进行比较，在几个实体类型基准测试中表现出最先进的性能和更好的预测一致性和置信度。

Abstract

neural entity typing models typically represent entity types as vectors in a high-dimensional space, but such spaces are not well-suited to modeling these types' complex interdependencies. We study the ability of box em

发现论文，激发创造

通过异质部分标签嵌入的实体类型标注噪声降噪

使用PLE的低维度空间嵌入实体提及、文本特征和实体类型，以自动消除知识库标签中的错误，并为每个训练实例估计其类型路径。

Feb, 2016

为新X (X = 语言、领域、风格) 迅速构建细粒度实体类型识别系统

本文提出了一种无监督实体类型框架，通过结合符号和分布语义，使用语言结构学习通用的嵌入，并开发了一种新型的联合层次聚类和链接算法来对所有提及进行类型。该框架不依赖于任何注释数据、预定义的打字架构或手工特征，因此可以快速适应新的领域、体裁和语言。同时，它具有很大的灵活性，可以包括语言结构等来改进特定上下文表示。

Mar, 2016

知识库实体的细粒度类型划分的多层次表示

本文研究自然语言中实体的多层表示学习方法，包括字符级、单词级和实体级。我们比较了各级别上的现有学习方法，确认每个级别的表示都提供互补信息，同时提出将三个级别的表示联合起来可以大幅度提高细粒度实体类型识别的性能，而添加实体描述信息能够进一步增强多层次的实体表示。

Jan, 2017

语料库级细粒度实体类型标注

本文提出FIGMENT模型解决了基于语料库的实体类型问题。该模型使用多层次的实体表示和远程监督的噪声缓解算法，实现了知识库完成的任务。在基于Freebase的大型实体类型数据集中，该模型表现出很好的效果。

Aug, 2017

使用TypeNet进行更细粒度的实体类型划分

介绍了TypeNet数据集，该数据集由1941个类型组成，通过人工注释从1081个Freebase类型映射到WordNet。本文还探讨了几种与先进系统可比的模型，以及在标准提及类型损失的基础上结合层次结构损失的技术，是未来研究的第一步。

Nov, 2017

通过增加话语上下文和自适应分类阈值进行细粒度实体类型划分

本文提出了一种神经架构模型，用于将fine-grained语义类型分配给实体提及，并学习利用比以前更多的语义上下文信息（文档和句子级别）的分布式语义表示。实验结果表明，该方法在三个基准数据集上取得了最先进的结果，而不需要手工特征。

Apr, 2018

超伪空间中的细粒度实体类型划分

本文研究了采用双曲嵌入表示大型实体类型库中的层次信息，以捕捉上下文中提及和目标类型之间的层次关系，从而提高实体类型命名性能。研究表明，双曲模型在不同的技术和数据集上表现出提高的效果，但在技术代码和数据集细节方面的差异也存在影响。

Jun, 2019

领域无关实体链接的细粒度实体类型划分

该论文介绍了一种可以构建鲁棒实体链接模型的方法，该方法将注意力放在建立细粒度实体属性的模型上，具有更好的泛化性能，使用维基百科类别的大型库存来远程标记数据并训练实体类型模型，使用软类型预测将提及链接到最相似的候选实体上。

Sep, 2019

通过大规模打标实现可解释的实体表示

本研究提出了一种利用细粒度实体类型推断模型生成具备人类可读性，且能够直接用于实体相关任务的实体表示向量的方法，并针对特定领域实体优化表征，通过少量规则增加领域知识以提高性能。

Apr, 2020

极地鸭与寻找它们的方法：通过鸭子类型和极地盒嵌入增强实体链接

本文提出了DUCK方法，在实体表示的空间中注入结构信息，使用实体类型的先前知识，并将关系表示为超球上的盒子，优化模型以将相似类型的实体放置在与其关系对应的盒子中。实验结果表明，该方法在标准实体消歧基准测试上设置了新的最佳结果，提高了模型的性能达7.9个F1点，优于其他类型感知方法，并与具有18倍更多参数的生成模型的结果相匹配。

May, 2023