Mar, 2019

DROP:一种要求段落级独立理解的阅读理解基准

TL;DR我们引入了一个新的英语阅读理解基准测试 DROP,它需要对段落内容进行离散推理。最佳系统仅在我们的广义准确性指标上实现32.7%F1,而专家人类表现为96.0%。