- MM利用确定性点过程和情境化表示进行多文档摘要
本研究分析使用深度上下文表示法的确定性点过程在提取式摘要中的应用,表明虽然使用深度表示法有一定效果,但仍需要使用表面指标来更好地识别摘要句。
- MM抽象摘要中的句子重写的摘要级别训练
本文通过使用句子重写模型,采用先提取常规句子,后对所选句子进行释义来生成摘要的策略,提出了一种通过强化学习直接最大化摘要级别 ROUGE 得分的新型训练信号,并在 CNN / Daily Mail 和纽约时报数据集上展示了新的最先进表现。在 - EMNLP结合全局和局部上下文的长文档摘要提取
本文提出了一种新颖的神经网络抽取式文档摘要模型,结合整个文档的全局上下文和当前主题内的局部上下文;我们在 Pubmed 和 arXiv 两个科学论文数据集上评估了该模型,并在 ROUGE-1,ROUGE-2 和 METEOR 分数上优于以前 - BottleSum: 应用信息瓶颈原理的无监督和自监督句子摘要
本文提出了一种新颖的无监督句子摘要方法,将信息瓶颈原理映射到条件语言建模目标上,并使用迭代算法逐渐搜索给定句子的较短子序列,同时最大化下一个句子在摘要条件下的概率,从而实现对大语料库的抽取式句子摘要,并基于此方法,提出了一种自我监督的抽象式 - ACL面向 facet 的提取式摘要评估
本文旨在为提高文本摘要信息覆盖性的评估提供一个新的基于 Facet 的评估方式,通过构建 CNN / Daily Mail 数据集的提取版本,在量化研究中证明,相对于 ROUGE,facet-aware 评估更好地与人类判断相关,能够实现细 - SIGIR基于产品描述和要点的句子排序以获得更好的搜索结果
本研究针对电子商务平台上的产品目录,利用基于命名实体识别(NER)的自然语言处理技术,运用强化学习实现提取与分类,选取标题和搜索点击记录中的关键信息,在汇总摘要的过程中避免信息过载,从而优化产品搜索效率,并对两种摘要模型进行了比较。
- ACL上下文提取式自监督学习
通过引入三种辅助预训练任务,从而以自监督的方式学习捕捉文档级上下文,进一步改善目前的提取式摘要模型,并在广泛使用的 CNN / DM 数据集上进行的实验验证了所提出的辅助任务的有效性。此外,我们显示出,在预训练后,一个由简单构建块组成的干净 - ACLMulti-News:一个大规模的多文档摘要数据集和抽象分层模型
本文介绍了首个大规模多文档新闻数据集 Multi-News,并提出一个将传统提取式摘要模型与标准单文档摘要模型结合的端到端模型,取得了有竞争力的结果。我们在 Multi-News 上比较了几种方法,并希望我们的数据和代码能促进多文档摘要领域 - EMNLP神经潜在抽取式文档摘要
本篇文章提出一种基于潜变量的抽取式文本摘要模型,通过使用句子作为潜变量和检索金标准摘要来改善基于启发式标签的抽取式模型,并在 CNN/Dailymail 数据集上得到了良好的结果。
- ACL使用不一致性损失的抽取式和生成式摘要统一模型
研究人员提出了一种统一模型,结合抽取性与生成性摘要的优势,通过句子级别的关注来调节单词级别的关注,采用新型的不一致损失函数,通过端到端的训练,实现了在 CNN / 每日邮报数据集上最先进的 ROUGE 分数和最信息化和可读性的摘要。
- 移动端自动生成中文简短产品标题
研究了一种从手动撰写的电子商务产品长描述中自动提取短标题的问题,为此我们提出了一种特征丰富的网络模型,并针对短文本输入的一种新的抽取式汇总问题。实验结果表明,这种框架显著优于几种基线,并获得 4.5% 的实质性提升。此外,我们还为电子商务短 - ACL用强化学习为抽取式摘要排序
提出了一种用于单文档大意提取的全新算法,能够通过强化学习目标全局优化 ROUGE 评估指标,并在 CNN 和 DailyMail 数据集上进行了实验,展示它在人工和自动评估中均优于现有抽取和生成式提取系统的神经大意提取模型。
- ICLR通过长序列摘要生成维基百科
通过抽取式摘要识别重要信息并使用神经摘要模型生成文章及段落以及整个维基百科文章,特别是引入可扩展关注长序列的仅解码器结构,当给定参考文献时,该模型可以提取相关的事实信息。
- 具有侧面信息的神经抽取式摘要生成
本文提出了利用辅助信息进行抽取式文本摘要的框架,该框架包括分层文档编码器和基于注意力机制的摘要提取器,利用大规模新闻数据集证明了与不使用辅助信息相比,利用辅助信息进行抽取式文本摘要可以更加有效地提高信息量和流畅度。
- ACLDRAGNN:用于动态连接神经网络的基于转移的框架
本文提出了一种紧凑,模块化的框架,用于构建新的循环神经网络结构,并介绍了一个基本模块 —— 转换型循环单元 (TBRU),它不仅具有隐藏层激活函数,而且还能够动态地构建网络连接,多个 TBRU 连接后能延伸和组合常用网络,最终实现更准确的多 - 分类或选择:抽取式文档摘要的神经网络结构
该论文介绍了两种基于循环神经网络的不同的架构,来进行文档的提取式摘要,这两种架构都能捕捉摘要中的关键信息和语句冗余,并且在两个不同语料库上都取得了超过其他监督学习方法的性能。
- AAAISummaRuNNer:基于循环神经网络的序列模型,用于文件摘要提取
本文介绍了 SummaRuNNer,一种基于递归神经网络(RNN)的序列模型,用于对文档进行抽取式摘要,并展示了它比同类现有技术表现更好或相当的性能。我们的模型具有解释性,因为它允许根据信息内容、显著性和新颖性等抽象特征可视化其预测结果。我 - ACL基于句子和单词提取的神经摘要
论文提出了一种基于神经网络和连续句子特征的数据驱动型抽取式摘要方法,采用层级文档编码器和基于注意力机制的提取器的通用框架,能够训练不同的摘要模型(提取句子或单词),在大规模语料库上进行实验结果表明,该方法在不需要语言注解的情况下取得了与现有 - 判别式书籍摘要新的对齐方法
采用不监督的方式对一本书的全文与人工撰写的摘要进行对齐,通过使用基于隐马尔科夫模型的两种新方法来解决长度差异的问题,并在抽取式书籍摘要任务上取得了一定的效果。尽管还有很大的提升空间,但无监督对齐在提供哪些书籍特征值得总结方面具有内在价值。
- 学习行列式点过程
该论文提出了一种基于特征的条件 DPP 模型的参数化形式,利用其进行了可行的、凸优化的学习,最终应用于文本摘要任务并获得了最先进的结果。