利用话语结构创建会议摘要
本文介绍了一种基于整数线性规划的句子融合方法,用于从多个发言中提取重要内容生成摘要,并实验证明该方法能够生成比现有基准更为信息丰富的自动生成会议记录的摘要。
Sep, 2016
提出一种使用话语关系进行无监督抽象化对话摘要生成的方法,并验证其在 AMI 和 ICSI 会议语料库上的有效性,ROGUE score 提升了 3 个点以上,甚至与现有的最先进方法竞争。
Feb, 2019
通过引入对话 - 话语关系来缓解会议总结的挑战,提出了一种 DDAMS 方法,可以显式地建模会议中话语之间的交互,实现关系建模并采用 DDADA 方法构建大型伪总结语料库,取得了 AMI 和 ICSI 会议数据集上最先进的实验结果。
Dec, 2020
该研究提出了通过使用结构化图表来建模话语关系和行动三元组,并设计多粒度解码器来生成摘要的方法,从而实现更准确、精确的抽象对话摘要。实验结果表明,该模型在自动评估和人类判断方面优于现有方法,并在其他领域具有很强的泛化能力。
Apr, 2021
我们提出了一种新颖的基于图形的框架,用于摘要会议演讲,完全不需要监督和任何注释。我们的工作结合了多种最近的方法的优点,同时解决了它们的弱点。此外,我们利用最近在 NLP 中应用的字嵌入和图形退化的进展,考虑外部语义知识,并设计了自定义的多样性和信息量度量。在 AMI 和 ICSI 语料库上的实验表明,我们的系统改进了现有技术水平。代码和数据可公开获取,我们的系统可以交互式测试。
May, 2018
本文提出了基于图神经网络(GNN)的抽取式摘要模型,并整合了深度神经主题模型(NTM)来发现潜在主题,从而提供句子选择的文档级特征,实验结果表明,我们的模型在 CNN/DM 和 NYT 数据集上取得了最先进的结果,在由较长文档组成的科学论文数据集上也明显优于现有方法,进一步研究表明,主题信息可以帮助模型从整个文档中预先选择凸显内容,因此能够有效地摘要长文档。
Oct, 2020
该研究提出了一种联合建模方法来识别口头会议中的显著讨论点,并标记发言者之间的话语关系;对于预测内容选择和话语关系,该联合模型在两个普及的会议语料库上表现出优于现有方法的结果;同时,使用基于该模型构建的特征训练分类器相较于现有技术能够显著提高团队成员对团体决策的理解一致性预测性能。
May, 2017
本文提出了一种基于无监督的基于图的排名模型,用于提取科学文献的摘要。我们的方法假定源文档采用两级分层图表示,并利用不对称的位置提示来确定句子的重要性。在 PubMed 和 arXiv 数据集上的结果表明,我们的方法在自动指标和人工评价方面优于强无监督基线。此外,其性能与许多基于监督学习的方法相当。这些结果表明,篇章结构中的模式是确定科学文章重要性的强有力信号。
May, 2020
本文研究了使用引文图来提高科学论文摘要生成的质量,提出了两种方法:为任务提供简单而低成本的多粒度无监督摘要生成方法 (MUS),以及对大量标记数据具有更准确结果的基于图的监督摘要方法 (GSS),并在公共基准数据集上进行了实验验证以证明方法的有效性。
Dec, 2022