Oct, 2022

Mintaka: 一个复杂、自然的多语言端到端问答数据集

TL;DR介绍了Mintaka,这是一个设计用于评估端到端问答模型的复杂、自然且多语言的数据集,包含20,000个问题-答案对,包含8种类型的复杂问题,其中包括最高级,交集和多跳问题,并在9种不同的语言(英语,阿拉伯语,法语,德语,印地语,意大利语,日语,葡萄牙语和西班牙语)进行了翻译。针对Mintaka运行了基线,其中最好的英文命中率@1为38%,多语言命中率@1为31%,表明现有模型仍有改进空间。