- ACL从超细到精细:微调超细实体类型模型至细粒度
通过使用超细粒度实体类型数据训练一个具有极广泛类型覆盖的实体类型模型,然后在新设计的细粒度实体类型模式下,通过少量手动标注的样本对先前训练的模型进行微调,我们提出了一种新的方法,能够避免在新类型架构时创建远距离标记数据的需求,并在低样本学习 - EMNLP通过共同预测提示调整学习纠正噪声标签的细粒度实体类型
为了解决细粒度实体类型任务中的噪声标注问题,引入了 Co-Prediction Prompt Tuning 方法,利用多个预测结果来识别和纠正错误标签,并设计了优化目标以考虑训练过程中的不一致预测,实验结果表明该方法显著提高了各种类型的训练 - 为实现精细化实体类型标注而进行的本体增强
OnEFET 是一种无需人工注释的高质量细粒度实体类型方法,通过对本体结构进行信息扩充,并利用训练样本扩充和话题信息的粗到细的分层方法,超越现有的零样本方法,赶上有监督方法。
- EnCore: 使用共指链预训练实体编码器
本文提出使用共指链作为一种额外的监督信号,在细颗粒实体类型识别的领域中,使用预训练策略可以提高最先进的技术水平。
- OntoType:本体指导的零样本细粒度实体类型识别,在预训练语言模型弱监督下
本文提出了一种本体导向的零样本方法 OntoType,使用多个预训练的语言模型和头部单词生成一组类型候选,并使用一个自然语言推理模型在本地上下文中对其进行分类,其表现优于其他零样本细粒度实体类型方法,同时实验还表明,对现有本体结构进行细化处 - COLING面向细粒度实体类型划分的类型丰富的分层对比策略
该论文提出了一种类型丰富的层次对比策略用于细粒度实体类型,使模型直接区分不同层次的类型差异并提高了区分多粒度相似类型的能力。在 BBN、OntoNotes 和 FIGER 三个基准上的实验结果表明,该方法通过有效地建模类型差异在 FET 上 - ACLReFinED: 高效的零射击能力端到端实体链接方法
本研究介绍了 ReFinED:一个高效的实体链接模型,使用细粒度实体类型和实体描述执行链接。该模型执行单向传递,可在文档中对所有提及进行提及检测、细粒度实体类型划分和实体消歧,使其比竞争性现有方法快 60 倍以上。ReFinED 在标准实体 - IJCAI细粒度实体类型自动嘈杂标签纠正
本文提出了一种新方法,通过估计先前模型的逻辑输出确定潜在的嘈杂标签,然后训练一个鲁邦模型来除去剩余的噪声标签,从而自动校正 FINE-Grained 实体类型任务中的嘈杂标签,证明了方法的有效性。
- 细粒度实体类型提示学习
本文探讨了使用 cloze 风格的语言提示刺激预训练语言模型的通用知识,并在完全监督、few-shot 和 zero-shot 情况下,根据实体类型实现了细粒度实体类型的提示学习,其中包括构建面向实体的语言生成器和模板,进一步提出的一种自监 - EMNLP一种完全双曲神经模型用于分层多类别分类
提出了一个全超伽马模型进行多类多标签分类,该模型可以从类别分布中推断出潜在的层次关系,捕获库存中的隐含下义关系,并显示出与最先进的方法相当的细粒度分类性能,具有可观的参数规模缩减。
- 一个用于细粒度实体类型标注的中文语料库
本文提出了一个包含 4800 个手工标注的中文语料库,其用于细粒度实体分类。在实验中,我们展示了一些典型细粒度实体分类模型在我们的数据集上的表现,并显示了通过跨语言迁移学习提高中文细粒度实体分类的可能性。
- EMNLP实体链接技术优化细粒度实体类型划分
通过实体链接,结合上下文信息和查询结果,我们提出了一种深度神经模型,用于精细化实体类型分类。在两个数据集上的实验结果表明,相对当前最先进水平,我们的方法分别取得了超过 5%的绝对严格准确度提高。
- ACLKCAT: 一种知识约束类型注释工具
该研究介绍了一种名为 KCAT 的工具,可以通过实体链接将候选类型的大小减少到可以接受的范围,并提供了一种多步骤类型方案来修正实体链接结果,从而显著提高注释效率和分析群众众包注释的综合管理模块,适用于细粒度实体类型注释的任务。
- ACL用紧凑的潜在空间聚类改进远程监督的实体类型识别
本研究针对远程监督 Fine-grained 实体类型标注(FET)中存在的错误实体类型标签问题,提出了 Compact Latent Space Clustering(CLSC)方法来进行正则化,并借助标签传播推断出嘈杂数据,在嵌入空间中 - ACL层次化损失及新资源对于细粒度实体类型和链接的作用
本文提出了使用双线性映射方法集成层次信息的新方法,相比于平面预测在实体链接和细粒度实体类型分类方面有显著的改进,并在基准 FIGER 数据集上实现了最新的最佳结果。
- 通过增加话语上下文和自适应分类阈值进行细粒度实体类型划分
本文提出了一种神经架构模型,用于将 fine-grained 语义类型分配给实体提及,并学习利用比以前更多的语义上下文信息(文档和句子级别)的分布式语义表示。实验结果表明,该方法在三个基准数据集上取得了最先进的结果,而不需要手工特征。
- KDD通过异质部分标签嵌入的实体类型标注噪声降噪
使用 PLE 的低维度空间嵌入实体提及、文本特征和实体类型,以自动消除知识库标签中的错误,并为每个训练实例估计其类型路径。