多级排序的分层实体类型推断
本文提出了使用双线性映射方法集成层次信息的新方法,相比于平面预测在实体链接和细粒度实体类型分类方面有显著的改进,并在基准 FIGER 数据集上实现了最新的最佳结果。
Jul, 2018
介绍了 TypeNet 数据集,该数据集由 1941 个类型组成,通过人工注释从 1081 个 Freebase 类型映射到 WordNet。本文还探讨了几种与先进系统可比的模型,以及在标准提及类型损失的基础上结合层次结构损失的技术,是未来研究的第一步。
Nov, 2017
本文提出了一种新的标签关系归纳偏好,利用图传播层有效编码全局标签共现统计和单词级别相似性,结合基于注意力的匹配模块,可以在包括超过 10,000 种自由形式类型的大型数据集上实现更高的召回分数,并且在输出的稳定性方面也更少不一致性。
Mar, 2019
本研究提出了一种基于神经网络模型的端到端解决方案,使用一种变种的交叉熵损失函数来处理上下文外标签,并使用分层损失规范化来处理过于特定的标签,利用公共词嵌入来训练单标签,从而同时学习实体提及及其上下文的表示,实验证明该方法对噪声具有鲁棒性,并在任务的已有基准测试中持续超过现有技术水平。
Mar, 2018
DeepType 是一种将符号信息显式地集成到神经网络推理过程中的模型,它通过构建类型系统并将其用于限制神经网络输出的符号结构来解决判断结构以及有效地捕捉信息的问题。在实验中,它用于 Entity Linking 任务,优于人工设计类型系统或最近使用深度学习相似性度量的方案,同时使用符号信息可以无需重新训练即可集成新实体。
Feb, 2018
该论文介绍了一种可以构建鲁棒实体链接模型的方法,该方法将注意力放在建立细粒度实体属性的模型上,具有更好的泛化性能,使用维基百科类别的大型库存来远程标记数据并训练实体类型模型,使用软类型预测将提及链接到最相似的候选实体上。
Sep, 2019
本文提出了一种无监督实体类型框架,通过结合符号和分布语义,使用语言结构学习通用的嵌入,并开发了一种新型的联合层次聚类和链接算法来对所有提及进行类型。该框架不依赖于任何注释数据、预定义的打字架构或手工特征,因此可以快速适应新的领域、体裁和语言。同时,它具有很大的灵活性,可以包括语言结构等来改进特定上下文表示。
Mar, 2016
本文研究了采用双曲嵌入表示大型实体类型库中的层次信息,以捕捉上下文中提及和目标类型之间的层次关系,从而提高实体类型命名性能。研究表明,双曲模型在不同的技术和数据集上表现出提高的效果,但在技术代码和数据集细节方面的差异也存在影响。
Jun, 2019
本文提出了一种本体导向的零样本方法 OntoType,使用多个预训练的语言模型和头部单词生成一组类型候选,并使用一个自然语言推理模型在本地上下文中对其进行分类,其表现优于其他零样本细粒度实体类型方法,同时实验还表明,对现有本体结构进行细化处理将进一步提高实体类型的细化。
May, 2023
该论文提出了一种类型丰富的层次对比策略用于细粒度实体类型,使模型直接区分不同层次的类型差异并提高了区分多粒度相似类型的能力。在 BBN、OntoNotes 和 FIGER 三个基准上的实验结果表明,该方法通过有效地建模类型差异在 FET 上实现了显著的性能提升。
Aug, 2022