- CLIMATELI: 评估气候变化数据中的实体链接
通过 CLIMATELI 数据集,评估现有的实体链接模型在气候变化主题中的表现,并提出用于气候变化实体的自动筛选方法
- 高效的生物医学实体链接:低资源技术下的临床文本标准化
通过学习实体的同义词对,我们提出了一种用于临床文本标准化的方法,通过关联多个术语,从而显著减少训练数据和资源消耗,并引入了基于上下文和无上下文重排序技术进行实体消岐。在最大的 UMLS 标注数据集 Medmentions 上,我们的方法表现 - 多语种实体链接基于密集检索
实体链接是将文本提及与相应实体连接的计算过程。本论文通过开发多个系统,证明了即使资源有限,也可以构建在多种语言中运作的竞争性神经网络实体链接系统,从而使实体链接更容易接近。
- ACL基于融合实例解码的实体消歧
提出了一种编码器 - 解码器模型来消除实体歧义,通过更详细的实体描述来改进基准性能,取得了强大而稳健的性能,尤其在 ZELDA 基准上比 GENRE 提高了 +1.5%,并在 GERBIL 基准的全流程实体链接中比 EntQA 提高了 +1 - 事件链接的论证感知方法
事件链接通过识别事件提及与知识库中相关的节点相连。该研究提出了一种关注事件参数的方法,以解决事件链接中的若干挑战,包括事件参数信息的识别和处理知识库外事件提及的问题。在两个测试数据集上进行的实验证明,该方法在处理知识库内外的情况下都取得了显 - ChatEL: 与聊天机器人进行的实体链接
ChatEL 是一个三步骤的框架,用于指示 LLMs 返回准确结果,能够提高 10 个数据集的平均 F1 性能超过 2%。
- 为知识图谱问答生成使用实体预训练 GPT 的 SPARQL
我们的研究致力于通过自然语言处理工具和创意鼓励来解决大众用户查询知识图谱的问题,我们的方法是通过正确的实体链接和训练 GPT 模型从自然语言问题中创建 SPARQL 查询,我们获得了在测试中 3 次查询命中准确度为 62.703%,实体链接 - ACL职场领域的实体链接
本文首次探索在职业技能与 ESCO 分类之间进行实体链接,使用高效的神经模型(双编码器和自回归模型)进行技能链接的实证研究。
- PEneo: 将线提取、线分组和实体链接统一为端到端文档对提取
PEneo 是一种新的文档对提取框架,通过线提取、线分组和实体链接三个并发子任务来解决语义实体识别和关系抽取的错误积累问题和多行实体情况,与 LiLT 和 LayoutLMv3 等网络结构相结合在各种基准测试中表现出良好的性能,提升大幅度( - EMNLP增加多语言知识图谱中文本信息的覆盖范围和精确度
自然语言处理和计算机视觉领域中近期的研究一直在利用知识图谱中可用的文本信息,例如实体名称和描述,来将神经模型与高质量的结构化数据对接。然而,在非英语语言中,可用的文本信息的数量和质量相对较少。为了解决这个问题,我们提出了自动知识图谱增强(K - EMNLP受指导的语言模型结合检索器是强大的实体链接器
通过指导性生成实体连接器,使常规语言模型在大规模知识库上能够进行实体连接,有助于克服生成模型的虚幻性,提高链接表现并提高数据和计算效率。
- SpEL:结构化实体链接的预测
该研究介绍了使用结构化预测进行实体链接的方法,提出了一种名为 SpEL 的实体链接系统,通过细化的微调步骤、上下文敏感的预测聚合策略以及减小模型输出词汇量等新思路,在实体链接任务中取得了比现有方法更好的性能,并且在计算效率方面表现出色。
- EMNLP重新审视稀疏检索用于少样本实体链接
通过稀疏检索方法和基于 ELECTRA 的关键词提取器,提出了一种改进的实体链接方法以精确连接知识库中的模糊提及,对于限定领域的有限标注数据,实验证明该方法在 ZESHEL 数据集上明显优于现有模型,在所有测试领域中表现出关键词增强稀疏检索 - PSYCHIC:一种用于知识图谱问答引擎的神经符号化框架
ISWC 2023 学术问答挑战中的 Scholarly QALD 任务中,我们提出了一种基于 PSYCHIC 的神经符号框架。该框架用于解决知识图谱上的问答问题,并在 DBLP-QUAD 任务中获得 00.18% 的 F1 评分和 71. - 一种新的自动形式化方法
自动形式化研究级数学的一个方法是将任务分解为更容易和可接近的子任务:未链接的形式化、实体链接和类型调整。同时,本文还提出了一个用于未链接的形式化的基准数据集 arXiv2Formal,其中包含了从 arXiv.org 的论文中选取的 50 - DBLPLink:DBLP 学术知识图谱的实体链接器
本研究介绍了一个名为 DBLPLink 的网络应用程序,它在 DBLP 学术知识图上执行实体链接。DBLPLink 使用文本到文本的预训练语言模型(如 T5)从输入文本问题中生成实体标签范围。实体候选者从数据库中根据标签获取,并且实体重排器 - 利用粗到细的基于词典的检索器改进少样本和零样本实体连接
本论文提出了一种基于词典的粗粒度到细粒度检索器,在两个层次上进行检索,以有效地检索实体候选项,并利用实体描述来消除与现有流行实体重名的尾部或新实体的歧义性,实验结果表明,我们的方法在不需要进行大量微调的情况下可以获得卓越的性能,在中文 Fe - DocTr: 用于文档结构化信息提取的文档转换器
本文提出了一种新的结构化信息提取(SIE)公式,可从视觉丰富的文档中提取实体,并介绍了两个相关方法:DocTr 和预训练策略,经实验证明,该公式及方法优于现有解决方案。
- 实体链接的检索器 - 阅读器范式的双向端到端学习
提出了一种新的双向端到端训练框架 BEER^2,有效改善了实体链接任务的性能。
- 多语言端到端实体链接
本文介绍了 BELA,这是第一个完全端到端的多语种实体链接模型,可以有效地在文本中检测和链接 97 种语言中的实体,并报告了其在四个实体链接数据集上的表现。