ACLFeb, 2024

通过关注多种标签嵌入进行准确和良好校准的 ICD 编码分配

TL;DR该论文描述了一种新颖的自动 ICD 编码方法,结合了先前相关工作的几个思想。我们特别采用一种强大的基于 Transformer 的文本编码模型,并针对冗长的临床叙述,探索了将基本编码模型调整为 Longformer,或者将文本分成块并独立处理的方法。编码器产生的表示与标签嵌入机制相结合,探索了多样的 ICD 编码同义词。通过使用 MIMIC-III 数据集的不同拆分进行实验,结果显示提出的方法在 ICD 编码方面优于当前最先进的模型,并且标签嵌入显著促成了良好的性能。该方法还导致适当校准的分类结果,可以有效地用于下游任务如数量化。