ACLJul, 2023

KU-DMIS-MSRA 在 RadSum23 的应用:用于放射学报告摘要的预训练视觉语言模型

TL;DR本文介绍 CheXOFA,这是一个新的预训练视觉语言模型,用于胸部 X 光域。该模型最初在普通领域的各种多模态数据集上进行预训练,然后迁移到胸部 X 光域。通过将各种特定于域的任务统一到简单的序列到序列模式中,使模型能够有效地从领域中有限的资源中学习所需的知识和技能。通过包括集成和事实校准在内的微妙技术,我们的系统在 RadSum23 排行榜的隐藏测试集上取得了第一名。