使用词图和 POV 转换的无监督抽象对话摘要

ACLMay, 2022

使用词图和 POV 转换的无监督抽象对话摘要

Unsupervised Abstractive Dialogue Summarization with Word Graphs and POV Conversion

Seongmin Park, Jihwa Lee

TL;DR本文利用多句压缩图技术推动无监督抽象对话摘要的研究前沿，通过路径重新排列和主题分段方案提升算法可靠性，并在跨领域数据集上实现算法健壮性。我们还探讨了将深度学习与启发式系统相结合的方案，以提高算法性能。我们开源我们的代码，为未来无监督对话摘要的研究提供了一个强有力的、可重复的基线。

Abstract

We advance the state-of-the-art in unsupervised abstractive dialogue summarization by utilizing multi-sentence compression graphs. Starting from well-founded assumptions about word graphs, we present simple but reliable

unsupervised abstractive dialogue summarization multi-sentence compression graphs path-reranking topic segmentation deep learning

发现论文，激发创造

多句压缩与预算次模最大化的无监督抽象会议摘要

我们提出了一种新颖的基于图形的框架，用于摘要会议演讲，完全不需要监督和任何注释。我们的工作结合了多种最近的方法的优点，同时解决了它们的弱点。此外，我们利用最近在 NLP 中应用的字嵌入和图形退化的进展，考虑外部语义知识，并设计了自定义的多样性和信息量度量。在 AMI 和 ICSI 语料库上的实验表明，我们的系统改进了现有技术水平。代码和数据可公开获取，我们的系统可以交互式测试。

May, 2018

基于话语和行为图的结构感知抽象性对话摘要

该研究提出了通过使用结构化图表来建模话语关系和行动三元组，并设计多粒度解码器来生成摘要的方法，从而实现更准确、精确的抽象对话摘要。实验结果表明，该模型在自动评估和人类判断方面优于现有方法，并在其他领域具有很强的泛化能力。

Apr, 2021

长篇科学文档的基于话语的无监督摘要

本文提出了一种基于无监督的基于图的排名模型，用于提取科学文献的摘要。我们的方法假定源文档采用两级分层图表示，并利用不对称的位置提示来确定句子的重要性。在 PubMed 和 arXiv 数据集上的结果表明，我们的方法在自动指标和人工评价方面优于强无监督基线。此外，其性能与许多基于监督学习的方法相当。这些结果表明，篇章结构中的模式是确定科学文章重要性的强有力信号。

May, 2020

基于话语关系重构的零样本抽象式对话摘要

提出一种使用话语关系进行无监督抽象化对话摘要生成的方法，并验证其在 AMI 和 ICSI 会议语料库上的有效性，ROGUE score 提升了 3 个点以上，甚至与现有的最先进方法竞争。

Feb, 2019

具有草图监督的可控抽象对话摘要

本文针对抽象对话摘要的质量和粒度控制问题，提出了一种包含两个主要组成部分和阶段的模型，实现了基于伪标注疑问代词类别和基于组成句法分析提取关键词短语生成初步摘要，并通过自动确定或控制源文本中不同文本片段预测和突出显示给定对话的生成摘要句子数量。在最大的对话摘要语料库 SAMSum 上表现出优越性能，达到了 50.79 的 ROUGE-L 评分，并展示了竞争性高的人类评估结果和可控制的效果。

May, 2021

依存关系文本图用于关键词和摘要提取，及其在交互式内容检索中的应用

通过聚集深度学习方法提供的依存句法分析器提供的链接形成的依赖图来建立神经网络和基于图的自然语言处理之间的桥梁，并通过提取最大强连通组件中的关键词和摘要来介绍统一的关键词、摘要和关系提取方法，从而构建一个新的对话引擎，利用内在结构信息提取命题之间的关系。

Sep, 2019

具有对话结构的多视角序列到序列模型用于摘要对话总结

本研究提出了一种多视角序列到序列模型，其通过提取来自不同视角的非结构化日常聊天中的会话结构来表示会话，然后利用多视角解码器来合并不同视角生成对话摘要，在大规模对话摘要语料库上的实验结果表明，本研究方法在自动评估和人类判断方面均明显优于之前的最新模型。

Oct, 2020

基于异构图网络的常识知识引入抽象对话摘要

该论文介绍了一种新型的多说话者对话摘要生成器，利用大规模的常识知识来促进对话理解和总结生成。实验表明我们的模型能够优化 SAMSum 数据集，并且也能够更好地适用于新领域的零样本实验。

Oct, 2020

利用依存图融合进行抽象会议摘要

本文介绍了一种基于整数线性规划的句子融合方法，用于从多个发言中提取重要内容生成摘要，并实验证明该方法能够生成比现有基准更为信息丰富的自动生成会议记录的摘要。

Sep, 2016

通过生成树状主题引导的句子进行无监督抽象意见摘要

本文提出了一种基于高斯混合模型的新颖非监督式抽象摘要方法。实验结果表明，该方法生成的主题句适合作为观点文本摘要，并且更具信息量和覆盖面。

Jun, 2021