- ACL文档级主张提取与脱离背景化以进行事实核查
我们提出了一种用于事实检查的文档级索取索赔的方法,旨在从文档中提取值得检查的要求,并将它们解除背景以便在任何环境下理解。使用自动评估指标和事实检查专业人员的评估结果表明,我们的方法比以前的工作更准确地从文档中提取出有价值的索赔,并改善了证据 - 评估文档简化:关于分开评估简易性和意义保留的重要性
本文关注文档级文本简化的评估,并使用不同的指标对现有模型进行比较,其中包括针对简化和意义保持性的指标。通过引入一个无参考的度量变体来展示模型在简化和意义保持两个维度上往往倾向于一方,并且在未知数据上应用现有模型的性能也得到了研究。
- EMNLP从简单到复杂:一个逐步进行的框架,用于文档层面的信息论证提取
基于文档的事件论证提取(EAE)需要从单个文档中提取多个事件的论证。我们提出了一个简单到复杂的渐进框架,通过计算每个事件的难度,并按照简单到复杂的顺序进行提取,以提供更可靠的记忆。在 WikiEvents 上的实验证明了我们的模型在 F1 - ACL利用语境线索和角色相关性增强文档级事件论元抽取
本文提出了一种 SCPRG(Span-trigger-based Contextual Pooling and latent Role Guidance)模型,它包含两个新颖有效的模块,用于解决文档级事件论证提取的问题,并在公共数据集上表现 - 基于相似度的增强记忆联合实体和关系抽取
本文介绍了一种多任务学习框架,其中任务之间存在双向记忆依赖,并能更准确地进行文档级别的实体和关系抽取,实证研究表明该方法优于现有方法,并在 BioCreative V CDR 语料库上取得了最新成果。
- 带有地理实体提及、指代和链接注释的步行游记数据集
该研究着重于文档级别的地理解析技术,提供了一个富有地理实体信息的旅行日志数据集,包括 200 个文档,12171 个提及,6339 个共指簇和 2551 个与地理数据库条目相关联的地理实体。
- 基于跨句推理图的文档级关系抽取
本文提出了一种新颖的文档级关系抽取模型 GRACR,其中构建了一个简化的语义图来建模文档中的所有实体和句子信息,以及一个实体级图来探索长距离跨句子实体对的关系。经实验证明,在文档级别关系抽取任务上,该方法取得了优秀的性能,并且在提取跨句子实 - HanoiT: 通过选择性上下文增强上下文感知翻译
本文提出了一种使用层间选择机制来筛选和优化长文档上下文的端到端编码器 - 解码器模型,以改善神经机器翻译的质量。 实验证明,该模型通过软选择机制在四组数据集上明显优于以前的模型。
- 扩展 TrOCR 实现全页扫描收据图像的文本免定位 OCR
本研究提出了一个基于 Transformer 的 OCR 模型,用于提取收据图像中的字符序列,无需定位文本。该模型能够在不需要额外处理的情况下,将整个收据图像中的字符识别准确,并按阅读顺序排列。
- EMNLP通过迭代推理实现更好的文档级关系抽取
本文提出了一种采用迭代推理的文档级关系抽取模型,包括一个基本模块和一个推理模块,推理模块引入了两个扩展交叉注意力单元,可以在关系推理过程中利用实体对的特征信息和之前的预测结果,通过对几乎无法预测的实体对进行处理以及引入对比学习等技术的二阶段 - ConstGCN:基于约束传输的图卷积网络用于文档层级关系提取
本文提出 ConstGCN 模型,利用基于知识的信息传播不需要事先构建图来解决训练和推理之间的图构建鸿沟,性能优于先前的最先进方法。
- ACL文档级论证抽取的动态全局内存
本文采用新型全局神经生成框架,构建文档存储器记录上下文事件信息,并利用它来隐式和显式地协助后续事件的参数解码,以解决从新闻文章中提取事件信息的挑战性问题,并且相比于之前的方法表现更出色并且对具有限制解码设计的对抗性注释样例更加稳健。
- ACL文档级信息抽取自动错误分析
本研究提出通过基于转换的框架实现文档级事件和关系提取自动化错误分析,进而比较两种最先进的模板填充方法在三个领域的数据集上的表现,并对信息提取领域自其 30 年前创始以来的发展进行了评估。
- ACLEA$^2$E: 基于事件感知的文档级论点抽取一致性改进
本研究针对现有文档级事件参与者角色提取模型无法在跨事件生成具有一致性的结果的问题,提出了基于事件关系的一致性约束机制,并介绍了一种集成上下文信息的事件感知 Argument Extraction 模型(EA^2E)来提升模型的一致性,WIK - ACL自适应焦点损失和知识蒸馏的文档级关系抽取
本文提出了一个半监督框架,包含三个新组件,针对文档级关系抽取任务进行优化,通过轴向注意力模块学习实体对之间的相互依赖关系、自适应 focal loss 解决 DocRE 的类别不平衡问题,以及使用知识蒸馏方法克服人工标注数据与远程监督数据之 - ACLFastKASSIM: 基于快速树内核的语法相似性度量
本文介绍了一种基于树核心的度量方法 FastKASSIM,它可以用于捕捉话语和文档级别的语法相似性和连贯性,与现有标准文档级语法相似性度量方法相比,FastKASSIM 更具鲁棒性且运行速度更快,可以预测 ChangeMyView 论坛上的 - EMNLPDMRST:面向文档级多语言 RST 篇章分割和解析的联合框架
本文提出一个基于文档级别的多语言 RST 话语分析框架,该框架将 EDU 分割和话语树解析结合在一起,并且引入了跨语言翻译增强策略,以支持多语言解析并改善其领域通用性,实验结果表明,该模型在所有子任务中实现了文档级别多语言 RST 解析的最 - ACLSIRE: 文档级别关系抽取中的分离句内和句间推理
本文提出了一种有效的架构 SIRE,以不同的方式表示内部和跨句子关系,设计了一种新的直接的逻辑推理模块,能够覆盖更多的逻辑推理链,并在公共数据集上取得了优异的实验效果和可靠性。
- ACLMLBiNet:跨句子事件集合检测网络
本文提出一种基于 Seq2Seq 的多层双向网络(MLBiNet)模型,用于在跨句子的情况下集体检测多个事件,并利用信息聚合模块和多层双向编码器来编码语义信息和事件之间的关联,从而提高跨句子检测的性能。
- ACL关于利用上下文预测学术论文句子的引用价值
探究在科学论文中预测引用价值的句子时,上下文作用的重要性,利用双向 LSTM 模型解决了该问题,并提出了一个新的基准数据集以及文档级别的训练 / 测试分配,通过误差分析揭示了上下文在预测引用价值方面的重要作用。