Jun, 2023

TimelineQA:基于时间线的问题回答基准

TL;DR本文介绍了一个对 Lifelogs 进行问题回答的基准测试 TimelineQA1,并通过多个实验比较了几种 QA 模型的性能。实验结果表明,对于原子查询,抽取式 QA 系统明显优于一种最先进的检索增强 QA 系统。对于涉及聚合的多跳查询,我们展示了使用最先进的表格 QA 技术的最佳结果,前提是可用于推导答案的真实事件集合可用。