自然与工程领域中的种子引导细粒度实体分类

AAAIJan, 2024

自然与工程领域中的种子引导细粒度实体分类

Seed-Guided Fine-Grained Entity Typing in Science and Engineering Domains

Yu Zhang, Yunyi Zhang, Yanzhen Shen, Yu Deng, Lucian Popa...

TL;DR研究了在科学和工程领域中基于种子引导的细粒度实体类型的任务，该任务利用名称和少量种子实体作为唯一的监督，旨在将新的实体提及分类为已知和未知类型，并提出了 SEType 方法来解决该问题。

Abstract

Accurately typing entity mentions from text segments is a fundamental task for various natural language processing applications. Many previous approaches rely on massive human-annotated data to perform entity typing

entity mentions entity typing science and engineering domains seed-guided fine-grained entity typing setype

发现论文，激发创造

为新 X (X = 语言、领域、风格) 迅速构建细粒度实体类型识别系统

本文提出了一种无监督实体类型框架，通过结合符号和分布语义，使用语言结构学习通用的嵌入，并开发了一种新型的联合层次聚类和链接算法来对所有提及进行类型。该框架不依赖于任何注释数据、预定义的打字架构或手工特征，因此可以快速适应新的领域、体裁和语言。同时，它具有很大的灵活性，可以包括语言结构等来改进特定上下文表示。

Mar, 2016

领域无关实体链接的细粒度实体类型划分

该论文介绍了一种可以构建鲁棒实体链接模型的方法，该方法将注意力放在建立细粒度实体属性的模型上，具有更好的泛化性能，使用维基百科类别的大型库存来远程标记数据并训练实体类型模型，使用软类型预测将提及链接到最相似的候选实体上。

Sep, 2019

超细粒度实体类型化

介绍了一种新的实体类型任务，使用头词来进行大规模远程监督，利用多任务目标训练模型，实现对实体类型的预测，对这一方法进行了实验评估并提供相关数据和模型。

Jul, 2018

零样本开放实体类型识别作为类型兼容接地

本文提出了一种无监督的零样本实体类型的方法，该方法可以弹性地识别新定义的类型，并利用 FREEBASE 的布尔函数进行自我推理。我们在包括生物领域的各种数据集上评估了该系统，并证明了它在超出领域的数据集上优于监督学习方法与其他零样本细粒度关键词方法。

Jul, 2019

实体链接技术优化细粒度实体类型划分

通过实体链接，结合上下文信息和查询结果，我们提出了一种深度神经模型，用于精细化实体类型分类。在两个数据集上的实验结果表明，相对当前最先进水平，我们的方法分别取得了超过 5％的绝对严格准确度提高。

Sep, 2019

OntoType：本体指导的零样本细粒度实体类型识别，在预训练语言模型弱监督下

本文提出了一种本体导向的零样本方法 OntoType，使用多个预训练的语言模型和头部单词生成一组类型候选，并使用一个自然语言推理模型在本地上下文中对其进行分类，其表现优于其他零样本细粒度实体类型方法，同时实验还表明，对现有本体结构进行细化处理将进一步提高实体类型的细化。

May, 2023

通过增加话语上下文和自适应分类阈值进行细粒度实体类型划分

本文提出了一种神经架构模型，用于将 fine-grained 语义类型分配给实体提及，并学习利用比以前更多的语义上下文信息（文档和句子级别）的分布式语义表示。实验结果表明，该方法在三个基准数据集上取得了最先进的结果，而不需要手工特征。

Apr, 2018

上下文相关的细粒度实体类型标记

这篇论文提出了一种上下文相关细粒度实体类型标注的方法，通过基于知识库提取实体和其类型，限制在本地上下文中可以推导的标签集，实验结果表明可以有效改善标注的精度。

Dec, 2014

CoType: 联合提取带类型实体和关系的知识库

本文介绍 “CoType”，一个数据驱动的文本分割算法和一种冠以知识库标签的实体及关系识别方法。实验表明，其在不同领域具有 25% 的 F1 得分提高。

Oct, 2016

从超细到精细：微调超细实体类型模型至细粒度

通过使用超细粒度实体类型数据训练一个具有极广泛类型覆盖的实体类型模型，然后在新设计的细粒度实体类型模式下，通过少量手动标注的样本对先前训练的模型进行微调，我们提出了一种新的方法，能够避免在新类型架构时创建远距离标记数据的需求，并在低样本学习设置下实现出色的细粒度实体类型识别性能。

Dec, 2023