Oct, 2023

基于树型对比学习的半结构化自动 ICD 编码研究

TL;DR通过研究调查临床记录的半结构化性质,我们提出了一种自动算法将其分割为不同的部分。为了解决现有 ICD 编码模型在数据有限性方面的可变性问题,我们引入了对于部分使用基于树编辑距离的软多标签相似度度量的对比预训练方法。此外,我们设计了一个掩码部分训练策略,使 ICD 编码模型能够定位与 ICD 编码相关的部分。广泛的实验结果表明,我们提出的训练策略有效地提升了现有 ICD 编码方法的性能。