ASPECTNEWS: 新闻文档的面向方面的摘要

ACLOct, 2021

ASPECTNEWS: 新闻文档的面向方面的摘要

ASPECTNEWS: Aspect-Oriented Summarization of News Documents

Ojas Ahuja, Jiacheng Xu, Akshay Gupta, Kevin Horecka, Greg Durrett

TL;DR本文介绍了一个数据集 AspectNews，并比较了不同训练方案的效果，研究表明最终方法可以生成更好的聚焦摘要，相比通用摘要系统或关键字匹配更为敏感。

Abstract

Generic summaries try to cover an entire document and query-based summaries try to answer document-specific questions. But real users' needs often fall in between these extremes and correspond to aspects, high-level topics discussed among similar types of documents. In this paper, we collect a dataset of realistic →

aspect-oriented summaries aspectnews dataset synthetic training data query-focused summarization keyword matching

发现论文，激发创造

WikiAsp：一个用于多领域方面的摘要的数据集

提出了一个新的多领域、开放领域的基于方面的摘要数据集 “WikiAsp”，该数据集通过使用 20 个不同领域的维基百科文章并使用每篇文章的标题和边界作为方面标注的代理。研究结果表明现有的摘要模型在此情况下面临的关键挑战，具体包括引用来源的代词处理和时间敏感事件的一致解释。

Nov, 2020

任何方面的文本总结：一种知识驱动的弱监督方法

本研究提出一种基于方面的抽象化摘要方法，可以对任意与文件相关的方面进行总结，带有外部知识库的弱监督构建方法和方面建模方案可以提高性能。

Oct, 2020

可控观点摘要

本论文提出了一种基于方面查询的定制摘要生成方法，使用多示例学习模型诱导的方面控制器创建 (review,summary) 对的合成训练数据集，通过微调预训练模型，生成修改方面控制器的方面特定摘要。在两个基准测试中，我们的模型表现优于先前的技术水平，并通过控制讨论的方面数量生成个性化摘要。

Sep, 2021

OASum：大规模开放领域基于方面的摘要

利用众包知识构建了高质量、大规模、面向开放领域的方面为基础的自动摘要数据集（OASum），包含超过 3.7 百万个实例，在 200 万个维基百科页面上涵盖了大约 1 百万种不同的方面类型，并在七个下游数据集上进行了数据零、少样本以及微调处理，显示出在方面或特定查询焦点生成能力方面，预先训练的模型表现出强劲的能力，数据集及预训练检查点已公开提供。

Dec, 2022

早并不总是更好：自动摘要中文本和系统偏见的子方面分析

对于神经摘要系统的明显改进及其依赖的语料库的基础逻辑尚未得到广泛探讨，因此本文提出了摘要的三个子方面：位置、重要性和多样性，并针对九个不同的摘要语料库（例如新闻、学术论文、会议纪要、电影剧本和书籍）进行了广泛分析。研究发现，尽管位置在新闻报道中存在重大偏见，但在学术论文和会议纪要等其他领域不是这种情况。此外，我们的经验证明不同类型的自动摘要系统（例如基于神经网络）由不同程度的子方面组成。因此，本研究提供了有关在收集新的摘要数据集或开发新系统时考虑基础子方面的有用信息。

Aug, 2019

使用子方面函数的条件神经生成模型用于提取新闻摘要

本研究提出了一种基于神经框架的文本摘要方法，引入了多种子方面的函数（包括重要性、多样性和位置等），可以根据不同控制码来决定在生成文本摘要时关注哪个子方面，以减少位置偏向性并提供更多的用户偏好选择。

Apr, 2020

ACLSum: 科学出版物面向方面的概述的新数据集

提供了一个由领域专家精心制作和评估的新型摘要数据集 ACLSum，集成了多个方面的科学论文摘要，通过对预训练语言模型和最先进的大型语言模型（LLMs）的性能进行广泛实验，探索学术领域中抽取式与生成式摘要的有效性，结果证实了在学术领域中端到端基于方面的摘要的普遍优越性。

Mar, 2024

AaKOS：基于知识的、面向方面的意见摘要

本文提出一种面向产品评论的自适应知识型意见摘要模型，有效地捕捉了意见摘要所需的自适应性质并生成面向方面的摘要，能更好地个性化和信息化地为用户提供有用信息，适应用户的不同兴趣和偏好。

May, 2023

收集意见：方面提取会见情感预测，并且它们均受弱监督

文中介绍了一种从在线产品评论中进行意见摘要的神经框架，该方法是知识瘦身的，只需要轻量级的监督，包括产品领域标签和用户提供的评分。方法结合了两个弱监督组件（一个偏向提取器和一个基于多实例学习的情感预测器），从多个评论中识别显著观点并形成提取式摘要。研究介绍了包括六个不同领域的产品评论的训练集以及具有黄金标准方面注释、显著标签和意见摘要的人工注释开发和测试集的意见摘要数据集。自动评估显示该方法相对于基线的显著改进，大规模研究表明根据多个标准，人类评判员更喜欢该方法的意见摘要。

Aug, 2018

使用方面抽取方法生成评论摘要和用户配置文件

本研究评估了一个新提出的神经模型在提取评论方面的可行性，结果表明该模型能够从用户评论中准确识别和提取各个方面并生成用户偏好的基于方面的概要。

Apr, 2018