TL;DR提出一种基于领域知识的主动学习(KAL)框架,将基于规则的知识转化为逻辑约束,以唤起模型对样本的选择。实验证明,该方法在平均 F1 分数方面优于多种主动学习策略,特别是在领域知识丰富的情况下,同时也适用于物体识别任务,并且计算需求较低。
Abstract
The deployment of deep learning (DL) models is still precluded in those
contexts where the amount of supervised data is limited. To answer this issue,
active learning strategies aim at minimizing the amount of la
深度学习主导的主动学习方法的调查;介绍了 DAL 任务,总结了最重要的基准和常用的数据集;系统地提供了 DAL 方法的分类,包括注释类型、查询策略、深度模型架构、学习范式和训练过程,并客观分析它们的优点和缺点;全面总结了 DAL 在自然语言处理、计算机视觉和数据挖掘等领域的主要应用;在对当前研究进行详细分析后,讨论了挑战和展望。