- 连接嵌入对知识图谱实体类型进行分类
本文提出了一种新方法,通过共同利用现有实体类型和知识图谱中的全局三元组知识以及两个嵌入模型,推断知识图谱中缺失的实体类型实例;在真实数据集上实验结果显示,此方法和模型可以有效地提高知识图谱实体分类。
- EMNLPEntEval: 实体表示的综合评估基准
在这项工作中,我们提出了 EntEval:一个测试套件,用于评估实体表示的整体质量,并通过使用维基百科中的自然超链接注释开发了学习更好的实体表示的培训技术,通过有效目标的检测, 显示这些目标可以改善多个 EntEval 任务上的强基线。
- ACL超伪空间中的细粒度实体类型划分
本文研究了采用双曲嵌入表示大型实体类型库中的层次信息,以捕捉上下文中提及和目标类型之间的层次关系,从而提高实体类型命名性能。研究表明,双曲模型在不同的技术和数据集上表现出提高的效果,但在技术代码和数据集细节方面的差异也存在影响。
- ACL学习去噪远程标记数据,用于实体类型划分
这项研究提出了一种使用两阶段过程来处理有噪音的远程标记数据的方法,包括滤波和修复嘈杂标签的模型,可以用于超细实体类型任务,具有比原始的远程数据或启发式去噪远程数据表现更好的性能。
- ACL引入标签关系归纳偏置来进行极细粒度实体类型推断
本文提出了一种新的标签关系归纳偏好,利用图传播层有效编码全局标签共现统计和单词级别相似性,结合基于注意力的匹配模块,可以在包括超过 10,000 种自由形式类型的大型数据集上实现更高的召回分数,并且在输出的稳定性方面也更少不一致性。
- ACL超细粒度实体类型化
介绍了一种新的实体类型任务,使用头词来进行大规模远程监督,利用多任务目标训练模型,实现对实体类型的预测,对这一方法进行了实验评估并提供相关数据和模型。
- NIPS使用 TypeNet 进行更细粒度的实体类型划分
介绍了 TypeNet 数据集,该数据集由 1941 个类型组成,通过人工注释从 1081 个 Freebase 类型映射到 WordNet。本文还探讨了几种与先进系统可比的模型,以及在标准提及类型损失的基础上结合层次结构损失的技术,是未来 - AAAI基于路径注意力机制的细粒度实体类型识别神经模型
该研究提出了一种名为 PAN 的端到端实体类型模型,通过利用类型的层次结构来学习噪声鲁棒性,该模型有效避免了在训练过程中的标签噪声和错误传播问题。
- BPEmb:275 种语言中的无需分词的预训练子词嵌入
BPEmb 是一个基于字节对编码(BPE)的资源高效、支持多种语言的预训练子词单元嵌入集合,经实验表现良好,特别是在实体类型上,有时优于替代的子词处理方法,可在不需要分词的情况下使用。
- ACL知识库实体的细粒度类型划分的多层次表示
本文研究自然语言中实体的多层表示学习方法,包括字符级、单词级和实体级。我们比较了各级别上的现有学习方法,确认每个级别的表示都提供互补信息,同时提出将三个级别的表示联合起来可以大幅度提高细粒度实体类型识别的性能,而添加实体描述信息能够进一步增 - ACL神经实体类型和关系抽取的噪声缓解
本文探讨了信息抽取模型中两种不同类型的噪声:来自远程监督和来自管道输入特征的噪声,并针对实体类型和关系提取等任务提出了使用神经网络模型的多实例多标签学习算法,以及改进噪声实体类型预测和关系提取间的整合方法,通过实验证明概率预测比离散预测更加 - 为新 X (X = 语言、领域、风格) 迅速构建细粒度实体类型识别系统
本文提出了一种无监督实体类型框架,通过结合符号和分布语义,使用语言结构学习通用的嵌入,并开发了一种新型的联合层次聚类和链接算法来对所有提及进行类型。该框架不依赖于任何注释数据、预定义的打字架构或手工特征,因此可以快速适应新的领域、体裁和语言