ASPECTNEWS: 新闻文档的面向方面的摘要
提出了一个新的多领域、开放领域的基于方面的摘要数据集 “WikiAsp”,该数据集通过使用 20 个不同领域的维基百科文章并使用每篇文章的标题和边界作为方面标注的代理。研究结果表明现有的摘要模型在此情况下面临的关键挑战,具体包括引用来源的代词处理和时间敏感事件的一致解释。
Nov, 2020
本论文提出了一种基于方面查询的定制摘要生成方法,使用多示例学习模型诱导的方面控制器创建 (review,summary) 对的合成训练数据集,通过微调预训练模型,生成修改方面控制器的方面特定摘要。在两个基准测试中,我们的模型表现优于先前的技术水平,并通过控制讨论的方面数量生成个性化摘要。
Sep, 2021
利用众包知识构建了高质量、大规模、面向开放领域的方面为基础的自动摘要数据集(OASum),包含超过 3.7 百万个实例,在 200 万个维基百科页面上涵盖了大约 1 百万种不同的方面类型,并在七个下游数据集上进行了数据零、少样本以及微调处理,显示出在方面或特定查询焦点生成能力方面,预先训练的模型表现出强劲的能力,数据集及预训练检查点已公开提供。
Dec, 2022
对于神经摘要系统的明显改进及其依赖的语料库的基础逻辑尚未得到广泛探讨,因此本文提出了摘要的三个子方面:位置、重要性和多样性,并针对九个不同的摘要语料库(例如新闻、学术论文、会议纪要、电影剧本和书籍)进行了广泛分析。研究发现,尽管位置在新闻报道中存在重大偏见,但在学术论文和会议纪要等其他领域不是这种情况。此外,我们的经验证明不同类型的自动摘要系统(例如基于神经网络)由不同程度的子方面组成。因此,本研究提供了有关在收集新的摘要数据集或开发新系统时考虑基础子方面的有用信息。
Aug, 2019
本研究提出了一种基于神经框架的文本摘要方法,引入了多种子方面的函数(包括重要性、多样性和位置等),可以根据不同控制码来决定在生成文本摘要时关注哪个子方面,以减少位置偏向性并提供更多的用户偏好选择。
Apr, 2020
提供了一个由领域专家精心制作和评估的新型摘要数据集 ACLSum,集成了多个方面的科学论文摘要,通过对预训练语言模型和最先进的大型语言模型(LLMs)的性能进行广泛实验,探索学术领域中抽取式与生成式摘要的有效性,结果证实了在学术领域中端到端基于方面的摘要的普遍优越性。
Mar, 2024
本文提出一种面向产品评论的自适应知识型意见摘要模型,有效地捕捉了意见摘要所需的自适应性质并生成面向方面的摘要,能更好地个性化和信息化地为用户提供有用信息,适应用户的不同兴趣和偏好。
May, 2023
文中介绍了一种从在线产品评论中进行意见摘要的神经框架,该方法是知识瘦身的,只需要轻量级的监督,包括产品领域标签和用户提供的评分。方法结合了两个弱监督组件(一个偏向提取器和一个基于多实例学习的情感预测器),从多个评论中识别显著观点并形成提取式摘要。研究介绍了包括六个不同领域的产品评论的训练集以及具有黄金标准方面注释、显著标签和意见摘要的人工注释开发和测试集的意见摘要数据集。自动评估显示该方法相对于基线的显著改进,大规模研究表明根据多个标准,人类评判员更喜欢该方法的意见摘要。
Aug, 2018
本研究评估了一个新提出的神经模型在提取评论方面的可行性,结果表明该模型能够从用户评论中准确识别和提取各个方面并生成用户偏好的基于方面的概要。
Apr, 2018