Oct, 2023

分割谐波损失:处理类别不平衡的多标签临床数据以适用于大规模语言模型进行医学编码

TL;DR通过在真实噪声数据上评估 Large Language Models (LLMs) 在医学编码任务的性能以及引入新的分段谐波损失函数来解决医学数据极度类别不平衡的问题,我们的实验结果表明,在训练过程中使用该损失函数,LLMs 在噪声长尾数据上取得了显著的性能提升,F1 分数超过最先进方法 10 个百分点以上。