- 整合知识库,提升化学领域的共指消解和桥接解析
化学专利中解决共指和桥接关系对于更好地理解精确的化学过程非常重要,我们提出了一种将外部知识纳入多任务学习模型的方法,用于化学领域中的共指和桥接关系的解析,结果表明整合外部知识可以改善化学共指和桥接关系的解决。
- 如何评估文学文本中的指代关系?
我们研究了用于评估文本共指的主要度量标准及其限制,并提出了一种新的评估共指的方法,该方法考虑了上下文,特别是小说分析中的长共指链,短共指链和独立元素,以便通过评估获得更可解释和信息量更丰富的结果。
- 新闻文章中多样化文档内实体共指注释的编码手册
该研究论文提出了一种通过考虑近似一致性和桥接关系来扩展传统身份关系范围的新闻文章共指注释方案,并详细描述了如何使用相应的注释工具 Inception 来设置,如何注释新闻文章中的实体,如何将它们与不同的共指关系联系起来,并链接到 Wikid - 将挪威 UD 树库与实体和指代信息对齐
本文提出了一个整合了个体和共指注释数据的合并集合,该集合基于挪威两种书写形式中的通用依赖 (UD) 树库,即 Bokmål 和 Nynorsk。该合并后的数据集提供了首个挪威 UD 树库,其中包含命名实体和共指信息。
- 聚合众包和自动判断来扩充小说和维基百科文本的先行参照语料库
通过玩游戏来标注语料库是一种有效的方法,本文提出了一种用于指代和共识关系的语料库,相对于先前发布的语料库,它具有更广泛的领域、更多的标记、更长的文档和更高的标注速度。
- Longtonotes: 更长的 OntoNotes 指代链
本研究建立了一个新的语料库 LongtoNotes,其中包含了英语文本中多种类型,长度不同的文档,并在其中评估了最新的神经共指系统,分析了模型结构 / 超参数与文档长度对性能和效率的影响,还提出了长文档共指建模中的改进问题。
- 提取式总结不忠实:提取式总结中广泛的不忠实问题调查
本论文通过定义五个宽泛的不忠实问题类型(包括和超越非蕴涵)以及其他误导信息,论证了导致摘要不忠实的核心问题主要出现在 extractive summarization 中的指代和话语上,提出了新的检测误差的方法 ExtEval,并指出现存的 - COLING语言模型在预测意大利指代零代词的指称对象方面是否具有人类化的表现?
本文研究了零代词在人类语言理解者及神经语言模型中的表现,通过在五组实验中,将句子中的零代词暴露给 12 个当代语言模型。研究发现其中三个模型成功模拟了人类的表现,这表明了人类语言基于语言经验的表现和语言模型更好地反映人类表现之间的联系。
- 对话问答中省略和指代检测的主动学习和多标签分类
本文提出了一种基于 DistilBERT 的多标签分类器,在有限的标记数据上采用多标签分类和主动学习来检测对话问答中省略和共指的现象,大大提高了分类器的性能。
- 使用分裂先行词消解打分核心链
本研究提出第一种将现有的认同指代度量泛化,以便它们也可用于评分分裂先行语情况的解决方案。
- 对话小说语料库》:文学文本引语归属的数据集
我们介绍了 Project Dialogism Novel Corpus (PDNC),这是一个包含有英语文学文本引用的注释数据集。PDNC 包含对 22 部小说中的 35,978 个引用的注释,并且是同类数据集中数量级最大的。每个引用都有 - 自注意力用于不完整话语改写
本文提出了一种新的方法,通过直接从 transformer 模型的自注意力权重矩阵提取 coreference 和 omission 关系,并相应地编辑原始文本,从而生成完整的话语,从而实现自然语言处理中的不完整话语改写任务。
- ACL条件生成实现的文档级事件论元抽取
本文提出了一种文档级神经事件关系抽取模型,将其作为一种条件生成的过程,并使用事件模板。此外,作者构建了一个新的包含完整事件和共指注释的文档级事件抽取数据集 WikiEvents。研究结果表明,该模型在事件论证抽取方面取得了较好的性能,并展示 - ACL单前体和复合前体指代消解系统:Stay Together
研究人员通过引入系统,解决了单一和分割前置的指代,并评估了使用预测提及的更加现实的情况下,如何使用标准的共同参考评估指标来评估单一和分割前置的指代。
- ACLGRIT: 文档级事件实体抽取的生成角色填充变换器
使用生成式基于 Transformer 的编码器 - 解码器框架,以考虑文档级别上下文信息的方法来重新思考文档级别下的角色 - 实体抽取问题,并在 MUC-4 数据集上展示其优越性。
- EMNLP利用世界知识奖励指代消解器的一致性
通过将 coreference resolver 的输出输入 relation extraction 系统,根据其在知识库中的三元组进行奖励,使用多任务强化学习获得最佳性能,改善了 coreference resolver 的性能。
- ACL利用话语重写提高多轮对话建模
该研究提出了一种将人类话语重写作为预处理方法,以帮助多轮对话建模。使用指针网络提出的基于 Transformer 的话语重写架构训练的话语重写器可以轻松地集成到在线聊天机器人中,并在不同领域带来一般性能的提升。
- ACL语义约束的多层标注:共指案例
本文提出一种基于 Universal Conceptual Cognitive Annotation 的共指注释方案,将谓语 - 论元结构作为实体和事件提及的基础,旨在解决现有方案面临的一些挑战,并考虑了与其他方案的比较。
- ACL基于动态跨度图的信息抽取通用框架
介绍了一个通用的框架,用于多个信息提取任务,共享动态构建的跨度图表示,该图由选择最可靠的实体跨度所构成,并使用置信度加权关系类型和共参考建立节点,从而实现共参考和关系类型置信度通过图传播迭代地细化跨度表示,与以前的多任务信息提取框架不同,我 - ACL参照读者:一种用于指代消解的循环实体网络
本文提出了一种新的架构,用于存储和访问实体提及,在进行在线文本处理过程中,通过将记忆操作编码为可微分的门,可以通过使用监督语音解析目标以及辅助语言模型目标来对模型进行端对端的培训,并通过代词 - 名称照应的数据集评估,证明了在完全增量文本处