Sep, 2018

一套盔甲能够导电吗?开放式问答的新数据集

TL;DR提出了一个新型问题回答数据集OpenBookQA,为评估人类对主题的理解而建模。与文档或知识库不同,OpenBookQA强调主题的深层理解,且包含更多来自不同来源的通用知识。在OpenBookQA上,人类表现接近92%,但许多最先进的预训练QA方法表现出乎意料的糟糕,不如几个简单的神经基线表现。