COLINGMar, 2024

在预算范围内进行注解:利用地理数据相似性平衡模型性能和注解成本

TL;DR提出了一种方法来平衡模型性能和注释成本,该方法通过找到与当前大型视觉语言基础模型训练数据集中的对象和行为最不相似的国家的图像来识别待注释的数据,并证明使用这些国家的数据来补充训练数据可以提高模型性能并降低注释成本。