Feb, 2025

多模态医疗编码分词器

TL;DR本文解决了现有医疗编码分词器仅将医疗代码视为孤立文本标记的不足,而未考虑它们的文本描述及其在本体层次中的位置和关系。通过引入MedTok,这一多模态分词器结合文本描述和关系结构,提高了医疗数据的分词效率,并在多个EHR模型上显著提升了相关任务的性能,尤其是在药物推荐领域展现出显著的改进。