Jun, 2024

具有深度学习和自然语言能力的辅助图像标注系统:一项综述

TL;DR本研究论文探讨了在计算机视觉任务中,超分辨率学习取得了显著的成功,但获取高质量的标注数据仍然是一个瓶颈。作者调查了 AI 辅助深度学习图像标注系统的学术和非学术作品,这些系统为注释者提供关于输入图像的文本建议、标题或描述,从而提高注释效率和质量。研究涵盖了各种计算机视觉任务的标注,包括图像分类、目标检测、回归、实例、语义分割和姿态估计。作者回顾了各种数据集以及它们对 AI 辅助标注系统的训练和评估的贡献。此外,作者还研究了利用神经符号学习、深度主动学习和自监督学习算法实现语义图像理解和生成自由文本输出的方法,包括图像字幕生成、视觉问答和多模态推理。尽管前景看好,但 AI 辅助图像标注与文本输出能力的公开可用作品有限。文章最后提出了未来研究方向的建议,强调了更多公开可用的数据集和学术界与工业界合作的必要性。