Jun, 2024

复杂时间问题回答的大规模数据集:ComplexTempQA

TL;DR我们介绍了ComplexTempQA,这是一个大规模数据集,包含超过1亿个问题-答案对,旨在解决时间问题回答中的挑战。ComplexTempQA在规模和范围上明显超越了现有的基准,如HOTPOTQA、TORQUE和TEQUILA。利用维基百科和维基数据的数据,该数据集涵盖了跨越两个十年的问题,并提供了无与伦比的广度。我们引入了一个独特的分类法,将问题分为属性、比较和计数问题,每种问题都围绕事件、实体和时间段展开。ComplexTempQA的一个显著特点是其问题的高复杂性,要求有效的回答能力,例如跨时间比较、时间聚合和涉及时间事件排序和实体识别的多跳推理。此外,每个问题都附带有详细的元数据,包括具体的时间范围,可以全面评估和增强大型语言模型的时间推理能力。ComplexTempQA既可以作为开发复杂AI模型的测试基础,也可以作为推进问题回答、信息检索和语言理解研究的基础。数据集和代码可以在以下网址免费获取:this https URL