Sep, 2023
临床文本去重实践:高效预训练与改进临床任务
Clinical Text Deduplication Practices for Efficient Pretraining and Improved Clinical Tasks
Isotta Landi, Eugenia Alleva, Alissa A. Valentine, Lauren A. Lepow, Alexander W. Charney
TL;DR通过利用大规模的真实临床数据集,本研究首先对常见写作习惯和临床相关性导致的冗余文本进行了细粒度的描述,接着证明了去重临床文本可以帮助临床语言模型以更高效的方式编码更少的冗余信息,并且通过基于提示的学习不会对分类任务造成伤害。