Nov, 2023

以数据为中心的长尾图像识别

TL;DR在长尾场景下,数据为模型提供了强大的需求,数据中心方法旨在增强数据的数量和质量以提高模型性能。本研究从特征多样性和分布转移的角度解决该问题,引入了特征多样性增益(FDG)的概念来阐明信息增强的有效性,实验证明使用FDG选择扩增数据可以进一步提高模型性能,而无需对模型的体系结构进行任何修改。因此,数据中心方法在长尾识别领域具有重要的潜力,超越了新模型结构的开发。此外,我们首次系统介绍了数据中心长尾学习框架的核心组件和基本任务,这些核心组件指导系统的实施和部署,而相应的基本任务则完善和扩展研究领域。