计算机视觉应用图像标注调查
本研究论文探讨了在计算机视觉任务中,超分辨率学习取得了显著的成功,但获取高质量的标注数据仍然是一个瓶颈。作者调查了 AI 辅助深度学习图像标注系统的学术和非学术作品,这些系统为注释者提供关于输入图像的文本建议、标题或描述,从而提高注释效率和质量。研究涵盖了各种计算机视觉任务的标注,包括图像分类、目标检测、回归、实例、语义分割和姿态估计。作者回顾了各种数据集以及它们对 AI 辅助标注系统的训练和评估的贡献。此外,作者还研究了利用神经符号学习、深度主动学习和自监督学习算法实现语义图像理解和生成自由文本输出的方法,包括图像字幕生成、视觉问答和多模态推理。尽管前景看好,但 AI 辅助图像标注与文本输出能力的公开可用作品有限。文章最后提出了未来研究方向的建议,强调了更多公开可用的数据集和学术界与工业界合作的必要性。
Jun, 2024
本研究针对视觉识别技术中的特征表示、学习算法和标记的训练数据进行了探究,提出了一种基于网络监督的自动图像数据生成方法,以实现对大量视觉概念的高效训练和识别。在 Pascal VOC 2007 数据集上对该方法进行了测试,并取得了明显的优越性能。
Jun, 2019
本文综述了关于图像分割的研究,特别关注了基于深度学习模型的语义分割和实例分割方法,包括全卷积像素标定网络、编码器 - 解码器架构、多尺度与基于金字塔的方法、循环神经网络、视觉注意力模型和对抗生成模型。我们探讨了这些深度学习模型的相似性,能力和挑战,并讨论了未来的研究方向。
Jan, 2020
本文研究了一种高效的策略收集多类别图像集的分类标签,使用自监督学习技术并将标注问题视为半监督学习问题,并提出了有效的标注指南,用此方案对 ImageNet100 图像集进行模拟实验,结果表明每张图像平均仅需 0.35 个标注,即可标注到 80% 的 top-1 准确率,相比之前的工作和手动注释,分别提高了 2.7 倍和 6.7 倍。
Apr, 2021
本研究引入了一个轻量级、用户友好、可扩展的框架 “Multilabelfy”,通过人机智能的协同作用,实现了高效的数据集验证和质量提升,同时突出了多标签占比的重要性,发现 ImageNetV2 数据集中约 47.88% 的图像包含至少两个标签,这凸显了对这类有影响力的数据集更严格评估的需求,并揭示了潜在标签数与模型准确性之间的负相关关系。
Jan, 2024
研究探讨在何种情况下可以采用自动标签来训练深度学习模型进行癌症组织切片图像分类,结果发现具有 10% 噪声标签的自动标签可以获得竞争性模型,而应用 Semantic Knowledge Extractor Tool (SKET) 算法生成的自动标签表现与手动标签相当,达到了与手动标签训练模型相当的稳定性能。
Jun, 2024
机器学习在医学影像领域取得显著进展。针对缺少标注数据,我们总结介绍了如何使用半监督、多示例、迁移学习等学习方法,特别是针对诊断和分割任务。同时,我们探讨了这些学习方法之间的联系和未来的研究机会。
Apr, 2018
本篇论文调查了计算机视觉中使用众包方法进行数据标注的类型,并讨论了一些有效的数据采集界面和工作流设计决策,以及智能选取最重要的数据实例进行注释的策略,最后探讨了众包在计算机视觉领域的未来发展。
Nov, 2016