贝叶斯查询聚焦摘要
本文提出了一种新的有监督方法,可以将丰富的句子特征合并到贝叶斯主题模型中,从而充分利用主题模型和基于特征的有监督学习方法进行查询焦点的多文档摘要, TAC2008 和 TAC2009 的实验表明了我们的方法的有效性。
Dec, 2012
本研究提出了基于问题回答模型的 QFS-BART 模型,通过显式的答案相关性,生成连贯且与答案相关的摘要,并在 Debatepedia 数据集上取得了最新的最优性能。
May, 2021
本文提出了一个基于句子压缩技术的任务框架,通过基于解析树的一系列学习模型,设计一种创新的 Beam Search 解码器来高效地找到高概率压缩结果,将语言学动机和查询相关性融入压缩过程中,并在多项指标上显著优于最先进的系统,包括在 DUC 2006 和 2007 摘要任务中分别获得 ROUGE-2 指标上 8.0% 和 5.4% 的改进。
Jun, 2016
本文提出了一种基于查询的文章摘要生成模型,使用新闻文章摘要数据集训练了指针生成模型,通过与参考摘要的相似度评估生成的摘要,结果表明可以构建类似于抽象式摘要的神经网络模型,使用查询生成有针对性的摘要。
Dec, 2017
该研究提出了一种基于神经网络的 MaRGE 模型,通过弱监督学习从支持证据中生成查询模型和自动生成摘要,从而实现基于查询的自动摘要,在查询爆炸性增长和追踪信息的需要下,取得了最先进的表现。
Dec, 2020
开发了一种基于抽象的总结框架,适用于多个异构文档,该框架独立于标记数据。 与现有的多文件总结方法不同,我们的框架处理讲述不同故事的文档,而不是同一主题的文档。 最后,我们基于 CNN / Daily Mail 和 NewsRoom 数据集构建了总共十二个数据集变体,其中每个文档组都包含大量且多样化的文档,以评估我们的模型与其他基线系统的性能。 我们的实验表明,我们的框架在这种更通用的情况下胜过了现有的最先进方法。
May, 2022
本研究定义了一个新的针对查询的表格摘要任务,并提出了一个新的名为 QTSumm 的基准测试,其中包含 5625 个在各种主题的 2437 个表格上人工注释的查询摘要对。实验结果和手动分析表明,我们的基准测试为未来的表格到文本生成研究提供了重要挑战和发展机会。
May, 2023
SUMO 是一种基于神经注意力机制的方法,可以通过文本证据(如新闻文章或 Web 文档)来确定文本声明的正确性。SUMO 可以通过呈现来自文档的多样化句子并解释其在文本声明正确性方面的决策,生成提取式摘要。相较于传统的单纯文本素材计算机制,SUMO 使用了改进的声明和标题指导的分层注意机制来模拟有效的上下文线索。在政治、医疗和环境领域的测试数据集上展示了我们方法的有效性。
Oct, 2020