Jul, 2024

大型语言模型在时间事件预测方面的综合评估

TL;DR基于构建了MidEast-TE-mini数据集,通过广泛实验证明,与将原始文本直接集成到LLMs输入相比,将原始文本融入特定复杂事件中并对LLMs进行微调能够显著提高性能,同时使用检索模块可以有效捕捉隐藏在历史事件中的时间关系模式,同时还揭示了在LLMs中仍存在的流行度偏见和长尾问题,为基于LLM的事件预测方法和未来的研究方向提供了深入理解和重要启示。