EMNLPDec, 2020

MeDAL: 医学缩写消歧数据集用于自然语言理解预训练

TL;DR本研究旨在解决临床环境中许多 NLP 方法面临的公共数据集稀缺问题,提出了一个大型医学文本数据集 MeDAL,针对缩写消歧设计,用于医学领域的自然语言理解预训练。我们在几种常见架构上预训练了多个模型,并在实验中表明这种预训练可提高下游医学任务的性能和收敛速度。