本文提出一种基于神经网络的端到端模型,实现了零样本抽象文本摘要,并基于 ROCStories 数据集引入了基准任务 ROCSumm。模型 SummAE 由去噪自编码器构成,通过将句子和段落嵌入到一个共同的空间中来生成段落的摘要。实验表明该模型可以比抽取式文本摘要技术更好地进行抽象文本摘要。
Oct, 2019
本文介绍了一种基于🈚️ground truth summaries 的情况下,利用文档创建合成数据集、引入多种噪声生成函数以及学习生成原始评论的摘要模型的方法,该方法比抽取式和生成式基线模型都有更好的效果。
Apr, 2020
本研究初步探讨一种新的方法,利用最大边际相关性方法从多文档输入中选择代表性句子,并利用抽象的编码器 - 解码器模型将不同的句子融合成概括性摘要。该适应方法自身鲁棒性良好且不需要训练数据。与自动指标和人工评估员评估的最先进的抽取和抽象方法相比,我们的系统表现出色。
Aug, 2018
本文介绍了 SummaRuNNer,一种基于递归神经网络(RNN)的序列模型,用于对文档进行抽取式摘要,并展示了它比同类现有技术表现更好或相当的性能。我们的模型具有解释性,因为它允许根据信息内容、显著性和新颖性等抽象特征可视化其预测结果。我们的另一个创新性贡献是抽象式训练抽取式模型,可以仅在人工生成的参考摘要上进行训练,消除了句子层面上的抽取式标签的需要。
Nov, 2016
本研究提出了一种基于变分自编码器的生成模型,可以在无监督学习的条件下,通过控制输入文本的变异程度,生成简明扼要、持有共识观点的评论摘要。
Nov, 2019
本文针对多文档自动摘要问题,提出了一个基于小型多文档训练集的神经抽象模型 fine-tuning 方法,实证结果在两个基准 DUC 数据集上表现优异。
Apr, 2018
论文提出了一种基于神经网络和连续句子特征的数据驱动型抽取式摘要方法,采用层级文档编码器和基于注意力机制的提取器的通用框架,能够训练不同的摘要模型(提取句子或单词),在大规模语料库上进行实验结果表明,该方法在不需要语言注解的情况下取得了与现有技术相当的效果。
Mar, 2016
本文介绍了一种学习无监督条款,在生成模型中引入少量样本来捕获其必要属性的方法,用于生成商品评论等主观性文本的摘要,该方法比以往的提取和抽象方法更有效。
本文提出了一种基于查询的文章摘要生成模型,使用新闻文章摘要数据集训练了指针生成模型,通过与参考摘要的相似度评估生成的摘要,结果表明可以构建类似于抽象式摘要的神经网络模型,使用查询生成有针对性的摘要。
Dec, 2017
本文综述了近期在基于神经网络的自动文本摘要中的十种最先进的神经网络模型,其中包括五种生成式模型和五种抽取式模型,并讨论了应用于摘要任务的相关技术和未来研究的有前途的方向。
Mar, 2018