自动提取引语引起注意

COLINGMay, 2020

Catching Attention with Automatic Pull Quote Selection

Tanner Bohn, Charles X. Ling

TL;DR本文提出自动提取引语的任务，通过一系列的基线方法，包括手工特征、神经混合专家和跨任务模型等方法，揭示了提取引语对于阅读理解的重要性，从而为如何吸引读者提供了新的认识。

Abstract

To advance understanding on how to engage readers, we advocate the novel task of automatic pull quote selection. Pull quotes are a component of articles specifically designed to catch the attention of readers with spans of text selected from the article and given more salient presentat

automatic pull quote selection article engagement neural mixture-of-experts embedding dimensions human evaluation

发现论文，激发创造

深度学习摘要模型中的内容选择

在新闻、个人故事、会议和医学文章等领域，我们使用深度学习模型进行摘要实验，以了解如何进行内容选择。我们发现，许多最先进的抽取式摘要生成器的先进功能并不能提高性能。这些结果表明，为新领域创建摘要生成器比先前的工作所建议的要容易，并质疑深度学习模型在摘要生成方面为那些具有大规模数据集（即新闻领域）的领域带来的好处。与此同时，他们提出了新的摘要研究的重要问题；换句话说，需要更适合摘要任务的新型句子表示或外部知识源。

Oct, 2018

超越文本生成：通过持续的自动文本摘要支持写手

本文提出了一个文本编辑器，使用自动文本摘要为用户提供不断更新的逐段摘要，以边缘注释的方式帮助用户规划、结构化和反思写作过程。通过两个用户研究，作者发现这个系统为用户提供了一个外部的视角来帮助他们修改段落的内容和范围，并且帮助用户快速了解文本的总体情况和开发一些集成自动摘要中得到的见解的策略。通过探究和强调设计 AI 工具以帮助写作的价值，这项工作突显了自然语言处理 (NLP) 能够超越直接的文本生成和纠正。

Aug, 2022

观点摘要的小样本学习

本文介绍了一种学习无监督条款，在生成模型中引入少量样本来捕获其必要属性的方法，用于生成商品评论等主观性文本的摘要，该方法比以往的提取和抽象方法更有效。

Apr, 2020

自下而上的抽象摘要

本文提出了一种简单的方法来解决神经网络摘要方法中存在的内容选择问题：使用数据有效的内容选择器来过度确定应该作为摘要的来源文档中的短语，通过作为自底向上的注意步骤来约束模型以生成更简洁而流畅的摘要。该方法比其他端到端内容选择模型更简单且性能更高，在 CNN-DM 和 NYT 语料库中表现出显著的 ROUGE 值提高。此外，内容选择器只需要训练 1000 个句子就可以使摘要器轻松地进行领域转移。

Aug, 2018

自动新闻摘要

本研究论文针对新闻文本自动摘要的抽取和生成方法进行了广泛的比较评估，重点分析了 ROUGE 分数。研究使用 CNN-Daily Mail 数据集，包括新闻文章和人工生成的参考摘要。通过 ROUGE 分数评估生成摘要的效果和质量，再将表现最佳的模型整合到 Web 应用程序中，评估其在真实世界中的能力和用户体验。

Oct, 2023

小说章节摘要中内容选择的探索

提出了一种通过在线学习指南的摘要 / 章节对生成小说章节摘要的新任务，重点是提取性摘要和对齐方法，通过创建出金标准提取性摘要句子以及实验不同的对齐方法，从而在自动指标等方面得出我们的任务比原先方法有了显著的改进，通过众包金字塔分析。

May, 2020

利用引线偏差进行零 - shot 抽象新闻摘要

本文提出了一种利用新闻报道中引文偏见进行先训练的方法，以预测文章中的前导句。作者把这种方法应用到 BART 和 T5 模型中，为领域适应打下基础，并通过六个基准数据集的实验表明，这种方法可以显著提高摘要质量，取得了零调整的新闻摘要的最新成果。

Dec, 2019

自动文本摘要方法：综述

本文详细介绍了文本摘要的各种方法，包括提取和抽象两种途径，评估指标、基准数据集与未来的研究展望，并讨论了生成摘要的不同评估方法与相关研究中可能出现的挑战和研究机遇。

Mar, 2022

下一步是什么？基于下一句预测的提取式摘要

使用 NEXTSUM 方法进行文章自动摘要，通过模型预测下一个句子是否应该包含在摘要中来兼顾信息的完整性和紧凑性，实验结果表明比传统方法表现更好。

Jan, 2019

信息丰富且可控的观点摘要

本文提出了一种摘要框架，通过将目标的所有评论压缩为多个密集向量以代替传统的前置筛选步骤，从而最大化地保留所有信息，进而生成更具信息量的摘要，并且采用零样本技术，能够有效地生成根据用户需求定制的摘要，实验结果表明了该模型在 Rotten Tomatoes 数据集上的优越性能。

Sep, 2019