Jan, 2024

利用人机交互提升计算机视觉数据集质量

TL;DR本研究引入了一个轻量级、用户友好、可扩展的框架 “Multilabelfy”,通过人机智能的协同作用,实现了高效的数据集验证和质量提升,同时突出了多标签占比的重要性,发现 ImageNetV2 数据集中约 47.88% 的图像包含至少两个标签,这凸显了对这类有影响力的数据集更严格评估的需求,并揭示了潜在标签数与模型准确性之间的负相关关系。