EMNLPNov, 2023

文本对齐到标签树层次结构的医疗分类不平衡问题

TL;DR本文提出了一种名为 Text2Tree 的新型算法,该算法只利用内部标签层次结构来训练深度学习模型,通过嵌入 ICD 标签树结构到级联注意力模块中,学习具有层次感知的标签表示。引入了相似度替代学习(SSL)和差异混合学习(DML)两种新的学习方案,通过重用和区分其他标签的样本来提高文本分类性能。实验证明,我们的方法在公共数据集和真实医疗记录上表现出优于传统和先进的不平衡分类方法的稳定性能。