Sep, 2024
非英语语言中小型不平衡数据集的放射学文本分类
Classification of Radiological Text in Small and Imbalanced Datasets in
a Non-English Language
TL;DR本研究针对小型不平衡数据集在非英语语言下的放射学文本分类问题,探讨了多种自然语言处理模型的性能,包括BERT及其变种、少量学习以及提示式大语言模型。研究发现,预训练于放射学报告的BERT模型在此场景下表现最佳,尽管所有模型仍需人工监督来提高分类精度,但它们在数据过滤方面显示出潜在价值。