Jun, 2020

面向少标签文本分类的不确定性自训练

TL;DR本文提出了一种基于贝叶斯深度学习的半监督学习方法,通过利用大规模未标记数据集,以文本分类为应用场景,仅使用 20-30 个样本能够训练出预训练语言模型的近似精度,相较于基线提高 12% 以上。