无监督舆情摘要生成与加噪声去噪声技术

ACLApr, 2020

无监督舆情摘要生成与加噪声去噪声技术

Unsupervised Opinion Summarization with Noising and Denoising

Reinald Kim Amplayo, Mirella Lapata

TL;DR本文介绍了一种基于🈚️ground truth summaries 的情况下，利用文档创建合成数据集、引入多种噪声生成函数以及学习生成原始评论的摘要模型的方法，该方法比抽取式和生成式基线模型都有更好的效果。

Abstract

The supervised training of high-capacity models on large datasets containing hundreds of thousands of document-summary pairs is critical to the recent success of deep learning techniques for abstractive summarization. Unfortunately, in most domains (other than news) such training data

abstractive summarization supervised learning synthetic dataset noise generation functions linguistically motivated

发现论文，激发创造

基于内容规划的无监督意见摘要

本文探讨深度学习在抽象性概括方面的成功，以及因评论摘要的训练数据不易获取而引发对依赖人工制作的方法的发展，提出通过采用内容计划的概念在评论摘要既可以获得更高质量的结果，也可以生成自然且更接近于真实世界的摘要 - 评论数据集。

Dec, 2020

观点摘要的小样本学习

本文介绍了一种学习无监督条款，在生成模型中引入少量样本来捕获其必要属性的方法，用于生成商品评论等主观性文本的摘要，该方法比以往的提取和抽象方法更有效。

Apr, 2020

无监督意见摘要作为抄袭评论生成

本研究提出了一种基于变分自编码器的生成模型，可以在无监督学习的条件下，通过控制输入文本的变异程度，生成简明扼要、持有共识观点的评论摘要。

Nov, 2019

通过选择有信息量的评论学习观点摘要器

本文研究了如何在大数据集上进行意见总结，并通过选择有信息量的评论子集并联合学习摘要生成器来解决这个问题。

Sep, 2021

用嘈杂对和局部监督进行观点摘要

本文提出了一种弱监督学习的意见摘要框架 NAPA，不需要客户和专业评论对作为训练数据，在自动评估指标和定性分析上得到了一致的改进，表明我们的系统可以生成类似专业评论员撰写的摘要。

Nov, 2022

自监督和可控多文档意见摘要

本文介绍了一种自我训练的方法，使用控制代码通过 Transformer 架构将多条评论进行无监督抽象摘要，并通过人工评估表明，该方法生成的摘要具有更高的质量和相关性。

Apr, 2020

信息丰富且可控的观点摘要

本文提出了一种摘要框架，通过将目标的所有评论压缩为多个密集向量以代替传统的前置筛选步骤，从而最大化地保留所有信息，进而生成更具信息量的摘要，并且采用零样本技术，能够有效地生成根据用户需求定制的摘要，实验结果表明了该模型在 Rotten Tomatoes 数据集上的优越性能。

Sep, 2019

OpineSum: 基于蕴含的自训练方法用于抽象意见摘要

本文提出了一种基于自我训练的抽象化意见摘要方法 OpineSum，该方法使用文本蕴涵的新颖应用程序来捕捉一个项目的各种评论中的意见共识，从而在大规模上获得银标准摘要并训练无监督和少量样本的摘要系统，而在结构中实现了最先进的性能。

Dec, 2022

利用去噪自编码器进行无监督的句子压缩

本研究通过加入噪声的方式进行了一个摘要任务来训练去噪自编码器从而实现了在不需要配对的语料库的情况下进行句子压缩。使用标准文本摘要数据集的人类评估表明，我们的模型与基于监督学习的语法正确性和意义保留基准相当，不需要目标数据，我们的无监督模型已经学会生成不完美但合理可读的句子摘要。

Sep, 2018

MeanSum: 一种用于无监督多文档抽象摘要的神经模型

本文提出了一种基于神经网络的无监督自动编码器架构，用于进行商品评论的抽象摘要，通过自动化指标和人类评估表明，该模型生成的摘要高度抽象、流畅、相关，并代表了输入评论的情感倾向。

Oct, 2018