扩展任务提示的网络新闻时间线生成
本论文提出了一种优化框架,设计用于平衡文章和评论摘要之间的主题连贯性以及其信息性和事件覆盖面。在真实数据集上自动评估表明,与现有系统相比,我们的系统生成的时间线更具信息性。在人类评估中,相关评论摘要更被认为具有洞察力。
Jun, 2016
本文开发了一种基于新闻领域概率性知识库的资源,提取事件之间的时间关系,可以用来改进现有的时间抽取系统,并提供有用的统计信息,从而有助于其他时间感知任务的开展。
Apr, 2018
探讨利用时间戳,如文档创建日期,将时间信息纳入到生成系统中的影响,研究时间感知提示的两种类型,并引入一个新的数据生成数据集 TempWikiBio,通过数据生成、文本传输和摘要三个数据集展示了使用线性提示和文本提示可以提高所有数据集的生成质量,线性提示对非时间信息更加关注,对时间敏感度较低,而文本提示可以产生更符合事实的时间信息。
Nov, 2022
本论文提出了一种统一的时间轴摘要生成器(UTS),它可以按时间顺序生成抽象和抽取式时间轴摘要,其中图形事件编码器和事件级关注机制是关键组成部分,实现了最先进的性能水平。
Jan, 2023
通过引入背景新闻摘要机制,结合时间轴更新,我们构建了一个数据集,并通过人工标注人员为每个新闻事件的每个时间步骤编写了背景摘要。我们提出了一个问题导向的变体来生成背景摘要,并使用基于问答的评估指标 Background Utility Score(BUS)评估了摘要质量。实验结果表明,在Fine-tuned 系统(如Flan-T5)和零-shot 性能强大的 GPT-3.5 的指导下,背景摘要表现出很好的效果。
Oct, 2023
本文研究信息检索在实时搜索中面临的挑战,通过整合事件信息和查询,利用跨注意力机制实现时间背景的查询表示,通过多任务训练增强事件表示能力,以及通过两阶段训练和硬负采样进行模型优化,并通过实验证明本方法在时间敏感场景下显著优于现有基线方法。
Dec, 2023
构建时间线需要识别文章中事件的时间顺序。为了解决缺失时间信息的问题,我们开发了一个新的评估数据集TimeSET,其中包含具有文档级顺序注释的单文档时间线。通过使用基于显著性的事件选择和部分排序,TimeSET能够实现实用的注释工作负载。为了构建更好的自动时间线构建系统,我们提出了一个新的评估框架,通过提示开放式LLMs(例如Llama 2和Flan-T5)使用TimeSET来比较多个任务表述。考虑到识别事件的时间顺序是时间线构建中的核心子任务,我们还在现有的事件时间顺序数据集上对开放式LLMs进行了基准测试,以获得他们能力的稳健理解。我们的实验结果表明,(1)采用Flan-T5的NLI表述在其他表述中呈现出较强的性能,而(2)时间线构建和事件时间顺序仍然是少样本LLMs面临的挑战性任务。我们的代码和数据可以在此链接找到。
Mar, 2024
使用大型语言模型从时态复杂事件中提取和分析关键点和时间戳,建立了评估时态动态和理解大量文本的基准。实验证明,采用合适的信息检索和长上下文窗口的模型在处理时态复杂事件的长篇新闻文章时表现出可比较的性能。
Jun, 2024
基于构建了MidEast-TE-mini数据集,通过广泛实验证明,与将原始文本直接集成到LLMs输入相比,将原始文本融入特定复杂事件中并对LLMs进行微调能够显著提高性能,同时使用检索模块可以有效捕捉隐藏在历史事件中的时间关系模式,同时还揭示了在LLMs中仍存在的流行度偏见和长尾问题,为基于LLM的事件预测方法和未来的研究方向提供了深入理解和重要启示。
Jul, 2024