跨页面关系的语义分析
本文提出了一种整合了一切的语义分析模型,采用词对分类问题的方法,运用最大熵分类器和特征选择工程解决了该领域迄今为止最大的特征空间问题,获得了 CoNLL-2008 共享任务评估数据集的最好性能。
Jan, 2014
本研究提出基于 Entity-level Relation Matrix 与 U-shaped Network 的 Document-level Relation Extraction 模型,通过结合上下文信息以及全局关系,实现了在 DocRED,CDR 和 GDA 三个基准数据集上的最优性能。
Jun, 2021
本文介绍了一种基于深度学习的语义依存图形式分析系统,该系统采用效率高且几乎拓扑结构简单的推理方法,通过组合双向 - LSTM 和多层感知机,能够在不使用手工特征或语法的情况下显著提高语义依存分析的技术水平。作者还对多任务学习策略进行了研究,并获得了新的技术成果。
Apr, 2017
通过构建神经网络模型,模拟句子和段落之间的相互依赖和连续性,并能够连续预测段落中的语篇关系,从而提高隐含的语篇关系分类的效果,并在 PDTB 的基准语料库上取得了最佳性能。
Apr, 2018
本研究提出了 SPADE 算法用于信息提取,通过空间依赖解析以解决半结构化文档图像的复杂空间关系问题,与 BERT 等强基线方法相比具有同等或更好的性能。
May, 2020
本文提出了一种新的架构 iDepNN,它可以通过循环和递归神经网络对最短和增强的依赖路径进行建模,以从跨句子的实体对中提取关系,并在新闻和医学领域的数据集上实现了最新技术的表现和更好的精度和召回的平衡,在 BioNLP 共享任务 2016 中胜过了 11 个参赛队伍,并获得了 5.2%的 F1 增益。
Oct, 2018
信息抽取任务涉及将非结构化文本内容自动转换为结构化数据。本文提出了一种从文本中提取和分类无限制关系集的方法,它基于远程监督方法获取的形态 - 句法抽取模式,并创建句法和语义索引来提取和分类候选图。我们在构建在 Wikidata 和 Wikipedia 上的六个数据集上评估了我们的方法。评估结果显示,我们的方法可以实现高达 0.85 的精确度得分,但召回率和 F1 得分较低。我们的方法可以快速构建基于规则的信息抽取系统,并构建注释数据集以训练基于机器学习和深度学习的分类器。
Jan, 2024
本文针对语义解析的性能进行改进,使用多任务学习方法,将 UCCA 解析作为测试案例,辅助任务包括 AMR 解析、SDP 解析和 Universal Dependencies 解析。实验表明,多任务学习显著提高了 UCCA 解析的性能。
May, 2018