AAAISep, 2020

医学考试开放领域大规模问答数据集:这位病人患有何种疾病?

TL;DR本研究提供了首个针对医疗问题的自由形式多项选择 OpenQA 数据集 MedQA,涵盖三种语言,并通过实现规则和神经网络两种方法进行实验,最终发现即使是当前最好的方法在英语、繁体中文和简体中文问题上也只能实现 36.7%、42.0%和 70.1%的测试准确率,希望这个数据集能够为推动未来更强大的 NLP OpenQA 模型的发展提供平台。