该研究综述了核指消解领域的现有语料库和评估指标,提供了基于规则的方法到最新的深度学习技术的核指算法概述,并调查了波斯语的核指消解和代词消解系统。
Nov, 2022
本文提出了一个使用弱监督技术的解析图片故事中指代关系的新技术,建立了包含核心链的图像文本数据集,并证明了该技术对提高图像叙事的效果。
本文综述了生物医学领域代词消解的最新发展现状,特别关注领域特定的语境语言模型以及多个架构。
Sep, 2021
本文提出了一种新的架构,用于存储和访问实体提及,在进行在线文本处理过程中,通过将记忆操作编码为可微分的门,可以通过使用监督语音解析目标以及辅助语言模型目标来对模型进行端对端的培训,并通过代词 - 名称照应的数据集评估,证明了在完全增量文本处理中具有强大的性能。
Feb, 2019
提出了一种基于聚类排名的共指解析方法,该方法结合了提及排名和实体 - 提及模型的优点,并通过两个扩展来改进聚类排名者的性能: (1) 词汇化和 (2) 通过联合建模代表性确定和共指解析来结合关于先行词类型的知识。实验结果表明,与竞争方法相比,此方法具有卓越的性能,并且我们的两个扩展措施是有效的。
Jan, 2014
本文提出了一个基于生成模型,引入 resolution mode 变量的无监督排名模型,用于实体的共指消解。该无监督系统在 CoNLL-2012 共享任务的英文数据上,通过 CoNLL 指标得分为 58.44%,超过了 Stanford 确定性系统(Lee et al.,2013)3.01% 的得分。
Mar, 2016
本文提出了一个简单而有效的跨语言理解模型来利用平行数据中的指代知识,该模型在 OntoNotes 5.0 英语数据集上使用 9 种不同的合成平行数据集实现了一致的提升,最高可达 1.74 个百分点。
May, 2023
文章综述了记录链接、实体解析、概率论、聚类和规范化等领域的历史发展、目前应用和未来研究方向。
Aug, 2020
本文提出了一种混合模型,通过将多个基于规则的筛子与针对代词的机器学习筛子相结合,解决了代词消解的挑战。该方法在 400 个文档的波斯语语言语料库中蕴含着出色的性能,并通过与先前模型的比较证明了其有效性。
研究自然语言处理的 NLP 和人工智能领域对实体理解的影响,提出了基于实体概念的方法,并介绍了如何在实体链接任务中使用这种方法。通过核指代文簇难题进行了实验研究,分析了知识库实体集成到文本中的方法并从时间视角分析了实体的演变。
Apr, 2023