自动提取引语引起注意
在新闻、个人故事、会议和医学文章等领域,我们使用深度学习模型进行摘要实验,以了解如何进行内容选择。我们发现,许多最先进的抽取式摘要生成器的先进功能并不能提高性能。这些结果表明,为新领域创建摘要生成器比先前的工作所建议的要容易,并质疑深度学习模型在摘要生成方面为那些具有大规模数据集(即新闻领域)的领域带来的好处。与此同时,他们提出了新的摘要研究的重要问题;换句话说,需要更适合摘要任务的新型句子表示或外部知识源。
Oct, 2018
本文提出了一个文本编辑器,使用自动文本摘要为用户提供不断更新的逐段摘要,以边缘注释的方式帮助用户规划、结构化和反思写作过程。通过两个用户研究,作者发现这个系统为用户提供了一个外部的视角来帮助他们修改段落的内容和范围,并且帮助用户快速了解文本的总体情况和开发一些集成自动摘要中得到的见解的策略。通过探究和强调设计 AI 工具以帮助写作的价值,这项工作突显了自然语言处理 (NLP) 能够超越直接的文本生成和纠正。
Aug, 2022
本文提出了一种简单的方法来解决神经网络摘要方法中存在的内容选择问题:使用数据有效的内容选择器来过度确定应该作为摘要的来源文档中的短语,通过作为自底向上的注意步骤来约束模型以生成更简洁而流畅的摘要。该方法比其他端到端内容选择模型更简单且性能更高,在 CNN-DM 和 NYT 语料库中表现出显著的 ROUGE 值提高。此外,内容选择器只需要训练 1000 个句子就可以使摘要器轻松地进行领域转移。
Aug, 2018
本研究论文针对新闻文本自动摘要的抽取和生成方法进行了广泛的比较评估,重点分析了 ROUGE 分数。研究使用 CNN-Daily Mail 数据集,包括新闻文章和人工生成的参考摘要。通过 ROUGE 分数评估生成摘要的效果和质量,再将表现最佳的模型整合到 Web 应用程序中,评估其在真实世界中的能力和用户体验。
Oct, 2023
提出了一种通过在线学习指南的摘要 / 章节对生成小说章节摘要的新任务,重点是提取性摘要和对齐方法,通过创建出金标准提取性摘要句子以及实验不同的对齐方法,从而在自动指标等方面得出我们的任务比原先方法有了显著的改进,通过众包金字塔分析。
May, 2020
本文提出了一种利用新闻报道中引文偏见进行先训练的方法,以预测文章中的前导句。作者把这种方法应用到 BART 和 T5 模型中,为领域适应打下基础,并通过六个基准数据集的实验表明,这种方法可以显著提高摘要质量,取得了零调整的新闻摘要的最新成果。
Dec, 2019
本文详细介绍了文本摘要的各种方法,包括提取和抽象两种途径,评估指标、基准数据集与未来的研究展望,并讨论了生成摘要的不同评估方法与相关研究中可能出现的挑战和研究机遇。
Mar, 2022
使用 NEXTSUM 方法进行文章自动摘要,通过模型预测下一个句子是否应该包含在摘要中来兼顾信息的完整性和紧凑性,实验结果表明比传统方法表现更好。
Jan, 2019
本文提出了一种摘要框架,通过将目标的所有评论压缩为多个密集向量以代替传统的前置筛选步骤,从而最大化地保留所有信息,进而生成更具信息量的摘要,并且采用零样本技术,能够有效地生成根据用户需求定制的摘要,实验结果表明了该模型在 Rotten Tomatoes 数据集上的优越性能。
Sep, 2019