WSDMJan, 2024

大型语言模型中的时间盲点

TL;DR该研究旨在调查通用型大型语言模型在需要时间理解的任务中面临的潜在限制,针对三个流行的时间问答数据集,我们发现大型语言模型在关于过去和新信息的详细问题上表现较差,存在多个时间错误,我们的分析有助于理解大型语言模型的局限性,并为开发更好满足时间导向任务需求的未来模型提供有价值的见解。