Feb, 2022

通过主动学习提高文本分类中的概率模型

TL;DR提出了一种将概率模型和主动学习结合起来的新算法,用于降低自动化文本分类的标注成本,实现对未标注数据和难分类文档的集中标注,性能可与最先进的方法相媲美,使用原有标注数据比最近发布的两篇研究中仅用一小部分标注数据得出的结论相同,并提供了 activeText 软件。