Jan, 2025
ChronoSense:探索大型语言模型中的时间理解与事件的时间间隔
ChronoSense: Exploring Temporal Understanding in Large Language Models
with Time Intervals of Events
TL;DR本研究针对大型语言模型在时间推理方面的不足,提出了ChronoSense基准,评估其时间理解能力。通过16个任务,重点考察Allen时间关系及时间算术,结果显示现有模型在处理这些关系时存在显著差异,且在时间相关问题上依赖记忆。该研究为提高大型语言模型的时间理解提供了重要依据和研究框架。