Jul, 2023

加强生物医学文本摘要与问答:领域特定预训练的效用

TL;DR生物医学摘要需要大规模数据集以训练文本生成。通过我们的研究,我们发现,虽然迁移学习是解决这一挑战的一个可行选择,但在一个 BioASQ 摘要任务中,域内预训练并不总是带来优势。我们确定了一种适合的模型架构,并使用它展示了一个通用领域预训练,并在 BioASQ 摘要任务的背景下进行任务特定的微调的好处,从而实现了一种新的三步微调方法,只需使用一千个域内示例即可。我们的结果表明,在某些特定领域的生物医学文本生成任务中,没有进行领域特定预训练的大规模语言模型可能具有明显优势。