COLINGSep, 2022

CLaCLab 在 SocialDisNER 的应用:使用医学词表识别西班牙语推文中的疾病实体

TL;DR该论文总结了 CLaC 团队对 SMM4H2022 任务 10 的研究,该任务涉及识别西班牙推文中提到的疾病。在将每个标记进行分类之前,该团队使用多语言 RoBERTa Large、UMLS 名录和 DISTEMIST 名录等特征对每个标记进行编码,最终获得了严格的 F1 得分为 0.869,与竞争平均值 0.675,标准偏差 0.245 和中级 0.761。