Sep, 2024

深度学习模型在视觉识别任务中对部分物体遮挡的鲁棒性研究

TL;DR本研究针对深度学习模型在部分遮挡条件下的识别能力不足的问题,提出了基于现实和人工遮挡图像的图像识别遮挡数据集(IRUO)用于测试和基准评估主流方法的鲁棒性。研究发现现代CNN模型在遮挡图像上的识别准确率较早期模型有所提高,而ViT模型在遮挡图像上的表现更优,接近人类识别的准确率,但某些遮挡类型仍显著影响模型的表现。