Feb, 2023

利用摘要指导进行医学报告摘要

TL;DR本研究提出了三个去识别化的医学文本数据集,命名为 DISCHARGE、ECHO 和 RADIOLOGY,共包含 50K、16K 和 378K 的报告和摘要对,作者在这些数据集上使用基于预训练编码器 - 解码器语言模型的有说服力的自动抽象摘要基线,并基于 BART 模型利用训练集的示例摘要作为先验知识引导来增强编码器和解码器的上下文表示,实验结果证实了这种方法在 ROUGE 分数和 BERTScore 上的改进,超过了更大模型 T5-large。