Nov, 2022

差模型的好数据:基于阈值的自动标注的基础

TL;DR本文分析了基于阈值的自动标注系统,推导了保证机器标注数据质量所需的人工标注验证数据量的样本复杂度上限,并通过模拟和实际数据集研究了基于阈值的自动标注在真实数据上的有效性和使用限制。