Sep, 2023

ExpertQA: 专家策划的问题及答案

TL;DR验证与归因对于领域特定的语言模型在高风险领域中提供准确信息至关重要,本研究通过领域专家的参与,对领域特定的语言模型生成的回答进行事实性和归因方面的评估研究,并构建了包含 32 个领域,2177 个问题以及验证答案和归因的高质量长型问答数据集 ExpertQA。