- 跨域神经实体链接
CDNEL 是一种跨领域神经实体链接框架,它通过学习不同领域知识库的联合表示空间来实现同时链接到通用领域知识库和特定领域知识库,其使用不同类型的数据集进行微调,从而得出不同的 CDNEL 模型变体。研究表明,使用 Zeshel 数据集中包括 - COLING寻找资金:使用不完整的资金知识库进行实体链接
该研究提出了一种基于 transformer 的实体链接模型,可在信息稀缺的情况下进行 NIL 预测,并且在自动提取资金信息,实体链接等方面具有显著的优势。
- 作者之团:从社交网络上下文中消除姓名歧义
研究使用关联网络和 BERT 来进行实体链接和共指消解,发现在领域内语言建模预训练和出版物信息可以显著提高任务性能,提出一种新的监督聚类推断模型并在两个数据集上进行了实验证 显示其具有竞争性能。
- 为新出现的实体学习实体链接特征
本文提出了一种自学习方法 STAMO 来学习新兴实体的实体链接特征,通过多槽位优化以及消除标签错误等策略,成功地解决了由于新兴实体缺少特征而导致实体链接模型无法正确链接的问题,并在两个实体链接数据集上实验验证了其有效性。
- Hansel: 一个中文 Few-Shot 和 Zero-Shot 实体链接基准
该论文提出了一个新的中文实体链接数据集 Hansel,用于解决现有实体链接系统中流行度偏差和英语以外语言中低频和新兴实体的缺乏问题。该数据集包含来自新闻、社交媒体和其他网络文章的 10K 个多样化文档,使用 Wikidata 作为其目标知识 - OSLAT: 医学实体检索和跨度提取的开放集标签注意力变换器
本文提出了一种基于 label-attention 机制的方法 (OSLAT) 来链接不需要跨度注释的开放实体集,可以用于实体抽取和链接等自然语言处理任务
- 元学习在有效的少样本命名实体链接中的应用
本研究提出了一种基于元学习、弱监督和合成数据的方法,以解决自然语言处理领域中少样本实体链接任务。在实验中证明,该方法在少量标注数据情况下可以获得较好的效果,并具有良好的可迁移性。
- ACLReFinED: 高效的零射击能力端到端实体链接方法
本研究介绍了 ReFinED:一个高效的实体链接模型,使用细粒度实体类型和实体描述执行链接。该模型执行单向传递,可在文档中对所有提及进行提及检测、细粒度实体类型划分和实体消歧,使其比竞争性现有方法快 60 倍以上。ReFinED 在标准实体 - 表格数据中的实体链接需要正确的注意
本文研究如何将表格数据与知识库中的实体进行实体链接。通过引入一个名为 Tabular Entity Linking Lite (TELL) 的模型,可以在不依赖于查询目标知识库中事实的情况下,以常数内存使用量为代价获得与当今最先进的基于注意 - QA 是新的 KR:将问题 - 答案对作为知识库
本文提出了一种新的基于问题生成和实体链接的知识库生成方法,该知识库由小的模块化组件组成,支持关系查询和多跳推理,与用户信息需求相匹配。
- 低资源语言的高效实体候选生成
本篇论文针对跨语言实体链接领域中的候选生成问题,提出了一种基于简单的索引构建的解决方法,特别适用于低资源语言,并在 9 个真实世界数据集上进行了充分的实证分析,结果表明在几乎所有数据集和查询类型中,该方法在质量和效率方面均优于现有方法。
- 对话中的个人实体、概念和命名实体链接
本文介绍了一种对话实体链接的工具,使用了不同于现有方法的技术来识别如人称实体和命名实体这种在对话中扮演重要角色的实体,并在实验中证明了其优于已有技术的性能。
- KE-QI: 知识增强的文章质量识别数据集
该研究为解决鉴别高质量文章的问题提出了一种基于外部知识的文章质量鉴定方法,并提出了相关的数据集和实体链接技术,实验结果表明该方法有效性较高。
- 构建冰岛实体链接语料库
本论文介绍了使用 mGENRE 多语言实体链接模型与 Wikipedia API Search(WAPIS)结合的方法,将其用于标注冰岛语数据,并与仅使用 WAPIS 的方法进行比较。结果表明,我们的组合方法在我们的语料库上达到了 53.9 - EDIN:未知实体发现和索引的端到端基准和流水线
本文提出了未知实体发现与索引(EDIN)基准测试方法,并基于稠密检索实体链接技术提出了端到端的 EDIN 流程,以检测、聚类和索引上下文中的未知实体,实验结果显示,将每个实体的嵌入整合起来得到单个嵌入的方法优于独立检索每个提及。
- IJCAI通过利用辅助数据进行社区问答实体链接
本文提出了一种新的任务:CQA 实体链接,通过有效利用 CQA 平台涉及的各种信息辅助数据(如平行答案、主题标签和用户等)来推进链接性能,使用一种基于 Transformer 的框架,在新发布的 CQAEL 数据集上通过实验验证了该框架的优 - IJCAI关系三元组提取:一步到位
本文提出了 DirectRel 模型,通过构建 “头实体→尾实体” 二分图的链接问题,直接在一步中提取所有的关系三元组,并在两个常用数据集上取得比现有技术更好的实验结果。
- ACL基于 Elasticsearch 的 BLINK 实现商业对话中高效实体链接
本文提出了一种神经实体链接系统,将商业对话中产品和组织类型实体与维基百科和维基数据项目相对应,并利用 Elasticsearch 在云机器中部署,以确保推理效率并获得显着的推理速度和存储空间消耗的改进,而仍保持高准确性。
- SU-NLP 在 SemEval-2022 任务 11 中的复杂命名实体识别与实体链接
本文介绍了 Sabancı大学自然语言处理小组在 SemEval-2022 MultiCoNER 任务中提出的系统。我们开发了一种无监督的实体链接流水线,利用维基百科检测潜在的实体提及,并使用相应的维基百科上下文来帮助分类器找到该提及的命名 - ACL基于实体简介生成的 Wikidata 实体链接候选集提升
该研究提出了一种基于实体建模的候选实体检索范式,该范式首先将 Wikidata 实体及其文本字段索引到文本搜索引擎中,再使用序列到序列模型生成目标实体的摘要,从而查询已索引的搜索引擎以检索候选实体,最后结合交叉注意力重新排序器,实现了在三个