大型语言模型在时间事件预测方面的综合评估

Jul, 2024

大型语言模型在时间事件预测方面的综合评估

A Comprehensive Evaluation of Large Language Models on Temporal Event Forecasting

He Chang, Chenchen Ye, Zhulin Tao, Jie Wu, Zhengmao Yang...

TL;DR基于构建了MidEast-TE-mini数据集，通过广泛实验证明，与将原始文本直接集成到LLMs输入相比，将原始文本融入特定复杂事件中并对LLMs进行微调能够显著提高性能，同时使用检索模块可以有效捕捉隐藏在历史事件中的时间关系模式，同时还揭示了在LLMs中仍存在的流行度偏见和长尾问题，为基于LLM的事件预测方法和未来的研究方向提供了深入理解和重要启示。

Abstract

Recently, large language models (LLMs) have demonstrated great potential in various data mining tasks, such as knowledge question answering, mathematical reasoning, and commonsense reasoning. However, the reasoning capability of LLMs on →

发现论文，激发创造

使用语言模型起草事件模式

本研究使用大型语言模型通过自然语言来起草事件模式，之后通过人工技术进行进一步的修订并将事件知识萃取到模式中。通过实验证明，大型语言模型在两个数据集中取得了适当的关键事件回调，并且我们的方法为更轻松地从大型语言模型中提取事件知识提供了可能性。

May, 2023

从大型语言模型中提取事件序列知识

利用大型语言模型生成事件序列，填补知识图中的知识空白，并通过模式挖掘和概率事件模型发现有用的和更复杂的结构化知识。

Jan, 2024

利用大规模语言模型增强时间序列分析：综述

对利用大型语言模型（LLMs）进行时间序列分析的现有方法进行了系统概述，总结了基于LLM的时间序列分析的一般流程，并探讨了未来的研究机会。

Feb, 2024

用于预测和异常检测的大型语言模型：系统文献综述

通过系统性文献综述，全面考察了在预测和异常检测中使用大规模语言模型（LLMs）的应用，突出了现有研究的现状、固有挑战和未来发展方向。LLMs已经在解析和分析大规模数据集以识别模式、预测未来事件和检测异常行为等各个领域展现了巨大潜力。然而，该综述指出了一些关键挑战，如依赖于大量历史数据集、在不同背景中的泛化问题、模型产生幻觉的现象、模型知识范围的局限性以及需要大量计算资源等，这些挑战阻碍了它们更广泛的应用和有效性。通过详细分析，本综述讨论了克服这些障碍的潜在解决方案和策略，如整合多模态数据，学习方法的进步以及强调模型可解释性和计算效率。此外，该综述还概述了可能影响LLMs在这些领域中发展的关键趋势，包括朝向实时处理、可持续建模实践的重要性和跨学科合作的价值。最后，该综述强调了LLMs对预测和异常检测可能产生的转变性影响，同时强调了持续创新、道德考虑和实际解决方案的需求以实现其全部潜力。

Feb, 2024

评估大型语言模型中的时间信息和推理技能

大型语言模型对于时间信息的推理和保留能力仍然有限，本论文通过在一个大规模时间数据集（TempUN）上实验，揭示了在时间保留和推理能力方面存在的显著局限。有趣的是，闭源模型更频繁地显示出知识缺口，可能表明在不确定性意识和错误响应之间存在折衷。此外，探索各种微调方法并没有带来显著的性能提升。

Feb, 2024

评估 LLMs 在时间泛化上的表现

大语言模型的发展迫切需要与语言理解和信息处理的提升相适应的评估方法。我们检查了当前的大语言模型，并揭示了它们在时间推理和偏见方面存在的各种时间偏见。我们提出了一个评估框架 Freshbench，用于动态生成最新的现实世界预测性预测的评估基准。

May, 2024

使用大型语言模型分析时间复杂事件：面向时间和长上下文理解的评测基准

使用大型语言模型从时态复杂事件中提取和分析关键点和时间戳，建立了评估时态动态和理解大量文本的基准。实验证明，采用合适的信息检索和长上下文窗口的模型在处理时态复杂事件的长篇新闻文章时表现出可比较的性能。

Jun, 2024

MM-预测：基于大型语言模型的多模态时间事件预测方法

本研究针对大型语言模型在时间事件预测中的多模态应用，尤其是利用图像数据的潜力尚未得到充分探索的问题。通过提出一个名为MM-Forecast的新框架，我们阐明了图像在时间事件预测中所扮演的功能，并证实了将这些功能描述纳入预测模型后，预测性能有显著提升。这一发现为未来多模态事件预测的研究提供了新的方向与方法。

Aug, 2024

对标准统计模型和大型语言模型在时间序列预测中的评估

本研究探讨了大型语言模型（LLMs）在时间序列预测中的应用，重点分析了LLMTIME模型。研究显示，尽管LLMs在生成文本、翻译和情感分析等任务中表现良好，但在处理复杂时间序列数据时，其预测准确性显著下降，尤其是当数据包含周期性和趋势成分时。这一发现强调了针对时间序列的LLMs的局限性和面临的挑战。

Aug, 2024

从新闻到预测：将事件分析整合入基于大语言模型的时间序列预测

本研究针对时间序列预测中的信息整合问题，提出了一种新颖的方法，通过大语言模型和生成代理，适应性地将各种社会事件纳入预测模型中。研究显示，该方法显著提高了预测准确性，可能引发时间序列预测领域的范式转变。

Sep, 2024