使用心理语言学理论,我们在提取式摘要中实现了对不重复且连贯的元素进行排名。这个系统可以控制信息检索量的预算,并通过实验证明在处理冗余文档时提供了更少冗余的摘要。
May, 2022
提出了一种多任务学习架构,用于基于从文本中提取摘要,其中包含摘要器和连贯判别器模块,通过预训练的转换模型(基于模型)和转换矩阵(MAT-based)将句子表示合并,实现了可微分训练,并以此最大化了连贯判别器的连贯度分数,并通过人工评估证实了我们方法提高了从原始文章位置开始提取的连续句子的比例以及有效保留了其他自动评估指标。
May, 2023
论文提出了一种基于神经网络和连续句子特征的数据驱动型抽取式摘要方法,采用层级文档编码器和基于注意力机制的提取器的通用框架,能够训练不同的摘要模型(提取句子或单词),在大规模语料库上进行实验结果表明,该方法在不需要语言注解的情况下取得了与现有技术相当的效果。
Mar, 2016
该研究旨在开发一种在多文档环境中的提取式摘要生成器,使用基于排名的句子选择方法以及连续向量表示和关键短语,并提出了一种模型来解决摘要连贯性问题,以提高可读性。实验结果表明,在信息量和连贯性方面,该方法相对于现有方法有了显著的改进。
Jun, 2017
本文提出了一种名为 RNES 的增强型神经汇总模型,在使用无标签数据的情况下,通过机器学习的方式训练该模型以优化汇总的连贯性和信息重要性,并通过实验证明了 RNES 的性能优于现有的基准模型,达到了 CNN/Daily Mail 数据集的最新性能。
Apr, 2018
本文提出了一种基于联合提取和句法压缩的神经模型用于单文档摘要,该模型选择文档中的句子,通过句法分析识别可能的压缩,并用神经模型评分这些压缩以生成最终的摘要,实验结果表明,该模型在 ROUGE 评估中表现良好,能够达到与最先进系统相当的性能,并且其输出一般保持语法正确。
Feb, 2019
通过使用点间互信息(PMI)计算相关性和冗余度量来提高提取性摘要,同时开展贪婪句子选择算法以最大化提取的句子的相关性和最小化冗余度。
Feb, 2021
一种基于孪生网络的无监督抽取式摘要模型,引入了可训练的双向预测目标,在选定的摘要和原始文档之间进行训练。与基于中心性排名的方法不同,我们的抽取式评分器可以进行端到端训练,无需位置假设。此外,我们通过近似 0-1 背包问题求解器引入了一个可微分的长度控制模块,用于端到端可控制长度的抽取。实验证明,相同的句子编码器下,我们的无监督方法在很大程度上优于基于中心性排名的基准方法。在长度控制能力方面,通过我们可训练的背包模块,性能始终优于强基准方法,而无需进行端到端训练。人工评估进一步证明,我们的方法在相关性和一致性方面优于基准方法。
Dec, 2023
本文介绍了一种利用文本连贯性理论中的对应点将文档中的句子融合成一篇连贯文本的方法,并创建了数据集以促进此技术的发展和测量。
Jun, 2020
提出了一种新的神经模型用于文本摘要,首先从文档中提取句子然后再压缩它们,达到了抽象方法所暴露出的难度和提取方法所缺乏的简洁性的平衡,且所提模型在 CNN/DailyMail 和 Newsroom 数据集上均取得了最先进的效果。
Apr, 2019