计算机视觉中的众包

Nov, 2016

Crowdsourcing in Computer Vision

Adriana Kovashka, Olga Russakovsky, Li Fei-Fei, Kristen Grauman

TL;DR本篇论文调查了计算机视觉中使用众包方法进行数据标注的类型，并讨论了一些有效的数据采集界面和工作流设计决策，以及智能选取最重要的数据实例进行注释的策略，最后探讨了众包在计算机视觉领域的未来发展。

Abstract

computer vision systems require large amounts of manually annotated data to properly learn challenging visual concepts. crowdsourcing platforms offer an inexpensive method to capture human knowledge and understan

computer vision crowdsourcing annotations data collection visual perception tasks

发现论文，激发创造

众包知识学习：简要综述与系统视角

本文从数据、模型、学习三个维度，全面回顾了 13 年来 AI 社区在众包学习领域的进展，着重提出了每个维度的一些有前途的蓝图，并探讨了过去研究的经验教训，旨在为新研究者提供指引，鼓励他们做出新的贡献。

Jun, 2022

带有约束条件的贝叶斯众包

本文探讨半监督众包分类在标签约束和实例约束两种情况下的贝叶斯算法，该算法基于变分推断，可以比无监督众包分类更有效地对人工注释信息进行聚合，该算法在多个众包数据集上的分析和实证验证了其表现的可量化提升。

Dec, 2020

生物信息学众包

本文介绍了如何理解和应用不同类型的众包系统，包括协作劳动、有目的性游戏、微任务市场和开放式竞赛，以及这些系统在生物信息学方面的成功案例和指南。

Feb, 2013

视觉众群分析：开放研究问题

自动化人群监测在计算机视觉领域引起了极大的关注，在过去十年里取得了显著发展。本文探讨了视觉人群分析的六个主要领域，并强调了每个领域的关键进展，同时揭示了未来需要解决的关键问题。通过选择在创新性或性能方面有重大贡献的重要工作，本文以更全面的方式呈现了当前最先进技术的先进性。

Aug, 2023

大规模图像分类数据集高效标注的良好实践

本文研究了一种高效的策略收集多类别图像集的分类标签，使用自监督学习技术并将标注问题视为半监督学习问题，并提出了有效的标注指南，用此方案对 ImageNet100 图像集进行模拟实验，结果表明每张图像平均仅需 0.35 个标注，即可标注到 80% 的 top-1 准确率，相比之前的工作和手动注释，分别提高了 2.7 倍和 6.7 倍。

Apr, 2021

众包标注群体真相的经验方法学

本篇文章提出了使用 CrowdTruth 衡量指标来有效地收集多领域多任务的 ground truth 数据，比传统的投票方式更具优势，并研究了人数增加对标注质量的影响。

Sep, 2018

众包监督下的细粒度计数

研究了利用众包注释进行细粒度计数的潜力，提出了一种新的数据集以及一种生成聚合真实数量和计数的方法，并利用聚合信息提高了计数精度，这表明众包监督有助于算法学习细粒度的计数。

May, 2022

从随机到有知识的数据选择：基于多样性的方法优化人工标注和少样本学习

在自然语言处理中，获取用于监督学习的带注释数据是一个重要挑战。本文提出了一种自动和明智的数据选择架构，用于建立用于少样本学习的小型数据集，以解决众包标注的问题。

Jan, 2024

家庭中的好莱坞：众包数据收集用于行为理解

使用 “好莱坞在家” 这一方法，提出了一种收集现实多样日常场景样本的新型数据集 Charades，以及在该数据集上进行的动作识别和自动化描述生成任务的基准结果，这有望为计算机视觉领域提供独特的挑战和机遇。

Apr, 2016

计算机视觉应用图像标注调查

本研究对图像标注软件进行了系统性的文献综述和分类，提出了组织结构、用户界面设计选项和用户支持技术的体系化方案，并应用于现有软件和文献领域，揭示了多个应用原型和关键领域，如医疗保健或电视中的图像检索或实例识别。

Apr, 2021