课程学习中的生成实体类型

EMNLPOct, 2022

Generative Entity Typing with Curriculum Learning

Siyu Yuan, Deqing Yang, Jiaqing Liang, Zhixu Li, Jinxi Liu...

TL;DR通过预训练语言模型和课程学习的方法，我们提出了一种新的生成式实体类型标注（GET）范例，其表现优于现有的实体类型标注模型。

Abstract

entity typing aims to assign types to the entity mentions in given texts. The traditional classification-based entity typing paradigm has two unignorable drawbacks: 1) it fails to assign an entity to the types be

entity typing generative entity typing pre-trained language model curriculum learning state-of-the-art models

发现论文，激发创造

细粒度实体类型提示学习

本文探讨了使用 cloze 风格的语言提示刺激预训练语言模型的通用知识，并在完全监督、few-shot 和 zero-shot 情况下，根据实体类型实现了细粒度实体类型的提示学习，其中包括构建面向实体的语言生成器和模板，进一步提出的一种自监督策略可以在提示学习中进行分布级别的优化，从而自动总结实体类型的信息，并表明当训练数据不足时，prompt-learning 方法明显优于 fine-tuning 基线。

Aug, 2021

为新 X (X = 语言、领域、风格) 迅速构建细粒度实体类型识别系统

本文提出了一种无监督实体类型框架，通过结合符号和分布语义，使用语言结构学习通用的嵌入，并开发了一种新型的联合层次聚类和链接算法来对所有提及进行类型。该框架不依赖于任何注释数据、预定义的打字架构或手工特征，因此可以快速适应新的领域、体裁和语言。同时，它具有很大的灵活性，可以包括语言结构等来改进特定上下文表示。

Mar, 2016

向实体引导的文本生成中注入实体类型

本文旨在在解码阶段对实体类型进行建模，以生成准确的上下文词汇，实验表明注入类型在实体提及生成过程中的表现优于现有的类型嵌入拼接基线。

Sep, 2020

领域无关实体链接的细粒度实体类型划分

该论文介绍了一种可以构建鲁棒实体链接模型的方法，该方法将注意力放在建立细粒度实体属性的模型上，具有更好的泛化性能，使用维基百科类别的大型库存来远程标记数据并训练实体类型模型，使用软类型预测将提及链接到最相似的候选实体上。

Sep, 2019

知识图谱上的实体类型的多视角对比学习

本文介绍了一种名为多视图对比学习的知识图谱实体类型推断方法，它将聚类提供的粗粒度知识编码到实体和类型嵌入中，并通过多个模块实现结构化信息的编码、不同视角的对比学习以及缺失实体类型的推断。实验证明了该方法相对于现有的最优方法具有较强的性能。

Oct, 2023

零样本开放实体类型识别作为类型兼容接地

本文提出了一种无监督的零样本实体类型的方法，该方法可以弹性地识别新定义的类型，并利用 FREEBASE 的布尔函数进行自我推理。我们在包括生物领域的各种数据集上评估了该系统，并证明了它在超出领域的数据集上优于监督学习方法与其他零样本细粒度关键词方法。

Jul, 2019

通过大规模打标实现可解释的实体表示

本研究提出了一种利用细粒度实体类型推断模型生成具备人类可读性，且能够直接用于实体相关任务的实体表示向量的方法，并针对特定领域实体优化表征，通过少量规则增加领域知识以提高性能。

Apr, 2020

自然与工程领域中的种子引导细粒度实体分类

研究了在科学和工程领域中基于种子引导的细粒度实体类型的任务，该任务利用名称和少量种子实体作为唯一的监督，旨在将新的实体提及分类为已知和未知类型，并提出了 SEType 方法来解决该问题。

Jan, 2024

自动标签解释与实例生成的少样本细粒度实体类型划分

本文提出了一个新的架构，包括两个模块：（1）实体类型标签解释模块，自动学习将类型标签与词汇表相关联的方法，（2）基于类型的上下文实例生成器，根据给定实例生成新实例，以扩大训练集以获得更好的泛化能力。在三个基准数据集上，该模型的性能明显高于现有方法。

Jun, 2022

OntoType：本体指导的零样本细粒度实体类型识别，在预训练语言模型弱监督下

本文提出了一种本体导向的零样本方法 OntoType，使用多个预训练的语言模型和头部单词生成一组类型候选，并使用一个自然语言推理模型在本地上下文中对其进行分类，其表现优于其他零样本细粒度实体类型方法，同时实验还表明，对现有本体结构进行细化处理将进一步提高实体类型的细化。

May, 2023