顺序复制网络
本研究提出了一种名为 CopyNet 的神经网络模型,集成了新的复制机制,可选择性地将输入序列中的子序列放置在输出序列的适当位置,对于文本摘要等任务表现更佳。
Mar, 2016
本文针对神经序列到序列模型不能完全符合文本和代码编辑需求,提出了一种扩展模型,通过一次性在输出中复制整个输入来减少决策次数,并衍生一种新的训练目标和变种 beam search 算法来处理输出生成的多样性问题,在自然语言和源代码的一系列编辑任务中实验表明,该模型始终优于简单基线。
Jun, 2020
本文提出了一种新的架构,通过使用混合指针生成网络和覆盖机制以增强标准的序列到序列注意模型来解决神经序列到序列模型不精确复制信息和重复问题,该模型在 CNN/Daily Mail 摘要任务上表现优异。
Apr, 2017
本篇论文开发了一种新的 Seq2Seq 模型,该模型将一个复制解码器和一个受限生成解码器融合在一起,并利用一个预测器来预测复制或重写的模式以确定最终输出,在两个不同的复述数据集上进行广泛的实验,结果表明我们的模型在信息量和语言质量方面均优于现有的最先进方法。
Nov, 2016
提出了一种具有显式令牌级别复制操作的模型,通过引入整个 span 的拷贝,提供了硬对齐的输入和输出间令牌间隔信息,可应用于信息提取等非传统 seq2seq 任务中,并在 Nested Named Entity Recognition 任务上取得了最先进的结果。
Oct, 2020
该研究提出了一种结构注入的复制机制,将源依赖关系结构与抽象的句子摘要生成器的复制机制自然地结合起来。实验结果显示将源语句的句法信息纳入系统的有效性,并且我们提出的方法与最先进的方法相比,取得了较好的效果。
Jun, 2018
本文介绍了一种名为 BioCopy 的插件式机制,通过在训练和推理阶段引入 BIO 标记和各种掩码策略提升了神经 seq2seq 框架下的输出准确性和生成任务的效果。
Sep, 2021
本文提出了一种新的 encoder-decoder 模型来解决 NLP 中的 sequence to sequence prediction 任务,新模型考虑了整个输入序列并引入复制机制来有效处理小样本集和 OOV 问题。在 Gigaword 数据集和 DUC 竞赛中,该模型的性能超过了现有模型。
Nov, 2016
本研究提出了一种名为交叉复制网络 (CCN) 的新型网络架构,可以同时探索当前对话上下文和类似对话实例的逻辑结构,证明了该算法在法庭辩论和客户服务内容生成等任务方面优于现有的最先进的内容生成模型。
Oct, 2020
本论文提出基于概念指针网络的抽象总结方法,使得生成的总结不仅保留了原文的关键信息,同时还生成了新的概念词汇来表达具体细节,而且采用了一种新颖的远程监督学习方法来优化训练模型。实验结果表明,该方法在 DUC-2004 和 Gigaword 数据集上显著优于多种最先进的模型。
Oct, 2019