本文从数据、模型、学习三个维度,全面回顾了 13 年来 AI 社区在众包学习领域的进展,着重提出了每个维度的一些有前途的蓝图,并探讨了过去研究的经验教训,旨在为新研究者提供指引,鼓励他们做出新的贡献。
Jun, 2022
本文探讨半监督众包分类在标签约束和实例约束两种情况下的贝叶斯算法,该算法基于变分推断,可以比无监督众包分类更有效地对人工注释信息进行聚合,该算法在多个众包数据集上的分析和实证验证了其表现的可量化提升。
Dec, 2020
本文介绍了如何理解和应用不同类型的众包系统,包括协作劳动、有目的性游戏、微任务市场和开放式竞赛,以及这些系统在生物信息学方面的成功案例和指南。
Feb, 2013
自动化人群监测在计算机视觉领域引起了极大的关注,在过去十年里取得了显著发展。本文探讨了视觉人群分析的六个主要领域,并强调了每个领域的关键进展,同时揭示了未来需要解决的关键问题。通过选择在创新性或性能方面有重大贡献的重要工作,本文以更全面的方式呈现了当前最先进技术的先进性。
Aug, 2023
本文研究了一种高效的策略收集多类别图像集的分类标签,使用自监督学习技术并将标注问题视为半监督学习问题,并提出了有效的标注指南,用此方案对 ImageNet100 图像集进行模拟实验,结果表明每张图像平均仅需 0.35 个标注,即可标注到 80% 的 top-1 准确率,相比之前的工作和手动注释,分别提高了 2.7 倍和 6.7 倍。
Apr, 2021
本篇文章提出了使用 CrowdTruth 衡量指标来有效地收集多领域多任务的 ground truth 数据,比传统的投票方式更具优势,并研究了人数增加对标注质量的影响。
Sep, 2018
研究了利用众包注释进行细粒度计数的潜力,提出了一种新的数据集以及一种生成聚合真实数量和计数的方法,并利用聚合信息提高了计数精度,这表明众包监督有助于算法学习细粒度的计数。
May, 2022
在自然语言处理中,获取用于监督学习的带注释数据是一个重要挑战。本文提出了一种自动和明智的数据选择架构,用于建立用于少样本学习的小型数据集,以解决众包标注的问题。
Jan, 2024
使用 “好莱坞在家” 这一方法,提出了一种收集现实多样日常场景样本的新型数据集 Charades,以及在该数据集上进行的动作识别和自动化描述生成任务的基准结果,这有望为计算机视觉领域提供独特的挑战和机遇。
Apr, 2016
本研究对图像标注软件进行了系统性的文献综述和分类,提出了组织结构、用户界面设计选项和用户支持技术的体系化方案,并应用于现有软件和文献领域,揭示了多个应用原型和关键领域,如医疗保健或电视中的图像检索或实例识别。