使用词图和 POV 转换的无监督抽象对话摘要
我们提出了一种新颖的基于图形的框架,用于摘要会议演讲,完全不需要监督和任何注释。我们的工作结合了多种最近的方法的优点,同时解决了它们的弱点。此外,我们利用最近在 NLP 中应用的字嵌入和图形退化的进展,考虑外部语义知识,并设计了自定义的多样性和信息量度量。在 AMI 和 ICSI 语料库上的实验表明,我们的系统改进了现有技术水平。代码和数据可公开获取,我们的系统可以交互式测试。
May, 2018
该研究提出了通过使用结构化图表来建模话语关系和行动三元组,并设计多粒度解码器来生成摘要的方法,从而实现更准确、精确的抽象对话摘要。实验结果表明,该模型在自动评估和人类判断方面优于现有方法,并在其他领域具有很强的泛化能力。
Apr, 2021
本文提出了一种基于无监督的基于图的排名模型,用于提取科学文献的摘要。我们的方法假定源文档采用两级分层图表示,并利用不对称的位置提示来确定句子的重要性。在 PubMed 和 arXiv 数据集上的结果表明,我们的方法在自动指标和人工评价方面优于强无监督基线。此外,其性能与许多基于监督学习的方法相当。这些结果表明,篇章结构中的模式是确定科学文章重要性的强有力信号。
May, 2020
提出一种使用话语关系进行无监督抽象化对话摘要生成的方法,并验证其在 AMI 和 ICSI 会议语料库上的有效性,ROGUE score 提升了 3 个点以上,甚至与现有的最先进方法竞争。
Feb, 2019
本文针对抽象对话摘要的质量和粒度控制问题,提出了一种包含两个主要组成部分和阶段的模型,实现了基于伪标注疑问代词类别和基于组成句法分析提取关键词短语生成初步摘要,并通过自动确定或控制源文本中不同文本片段预测和突出显示给定对话的生成摘要句子数量。在最大的对话摘要语料库 SAMSum 上表现出优越性能,达到了 50.79 的 ROUGE-L 评分,并展示了竞争性高的人类评估结果和可控制的效果。
May, 2021
通过聚集深度学习方法提供的依存句法分析器提供的链接形成的依赖图来建立神经网络和基于图的自然语言处理之间的桥梁,并通过提取最大强连通组件中的关键词和摘要来介绍统一的关键词、摘要和关系提取方法,从而构建一个新的对话引擎,利用内在结构信息提取命题之间的关系。
Sep, 2019
本研究提出了一种多视角序列到序列模型,其通过提取来自不同视角的非结构化日常聊天中的会话结构来表示会话,然后利用多视角解码器来合并不同视角生成对话摘要,在大规模对话摘要语料库上的实验结果表明,本研究方法在自动评估和人类判断方面均明显优于之前的最新模型。
Oct, 2020
该论文介绍了一种新型的多说话者对话摘要生成器,利用大规模的常识知识来促进对话理解和总结生成。实验表明我们的模型能够优化 SAMSum 数据集,并且也能够更好地适用于新领域的零样本实验。
Oct, 2020
本文介绍了一种基于整数线性规划的句子融合方法,用于从多个发言中提取重要内容生成摘要,并实验证明该方法能够生成比现有基准更为信息丰富的自动生成会议记录的摘要。
Sep, 2016
本文提出了一种基于高斯混合模型的新颖非监督式抽象摘要方法。实验结果表明,该方法生成的主题句适合作为观点文本摘要,并且更具信息量和覆盖面。
Jun, 2021