Aug, 2023

一种适用于中文医学标点恢复的小型且快速的 BERT 模型

TL;DR基于 “预训练和微调” 范式的快速轻量级中文医学标点还原模型,通过引入监督对比学习和新颖的辅助预训练任务(标点符号预测),蒸馏预训练模型以适应标点还原需求,实验表明,该模型在相对于最先进的中文 RoBERTa 模型的 10% 模型尺寸下能够达到 95% 的性能。