ACLJun, 2024

SPAGHETTI:异构数据源的开放领域问答 —— 检索和语义解析

TL;DRSPAGHETTI 是一个混合问答 (QA) 流水线,利用来自知识库、文本、表格和信息框的异构知识源,通过 LLM 增强方法在 Compmix 数据集上取得了最先进的性能,达到了 56.5% 的精确匹配(EM)率。更重要的是,对数据集的一部分进行手动分析表明,SPAGHETTI 的准确率超过 90%,表明 EM 不再适用于评估当前的 QA 系统的能力。