生物信息学众包
本篇论文调查了计算机视觉中使用众包方法进行数据标注的类型,并讨论了一些有效的数据采集界面和工作流设计决策,以及智能选取最重要的数据实例进行注释的策略,最后探讨了众包在计算机视觉领域的未来发展。
Nov, 2016
本文探讨半监督众包分类在标签约束和实例约束两种情况下的贝叶斯算法,该算法基于变分推断,可以比无监督众包分类更有效地对人工注释信息进行聚合,该算法在多个众包数据集上的分析和实证验证了其表现的可量化提升。
Dec, 2020
通过研究发现,微任务众包平台能够有效地捕捉 PubMed 文摘中的疾病提及,并通过专家投票方法将多个工作者的注释合并,生成 BioNLP 领域中完全标注的语料库。
Aug, 2014
本文从数据、模型、学习三个维度,全面回顾了 13 年来 AI 社区在众包学习领域的进展,着重提出了每个维度的一些有前途的蓝图,并探讨了过去研究的经验教训,旨在为新研究者提供指引,鼓励他们做出新的贡献。
Jun, 2022
该研究总结了一个名为 ' 人类计算 ' 的新领域,介绍了网络系统中人力驱动的成功案例以及如何通过科学研究改进在线群体驱动系统,以实现其潜力最大化,推进社会进步。
May, 2015
本研究提出一种将机器学习与众包数据库结合的主动学习算法,以实现众包应用程序的可扩展性,并通过实验证明:相比于以往的主动学习方案,我们的方法平均只需要人类标记 1-2 个数量级的数据集就能实现与随机采样相同的精度。
Sep, 2012
本文描述了在计算机科学高等教育课程中采用众包技术作为作业的方法和经验教训。通过音乐的相关元数据,采用一种支持文化遗产领域众包的平台并使用语义网技术分析了众包结果。结果为机器学习模型提供了一个公开可用的标注数据集,并且在线调查的反馈得出了将众包技术纳入计算机科学课程的好处和挑战。
Jun, 2023
该研究介绍了一种基于众包的数据分析系统,其中包含了质量敏感型质量控制模型,并利用 Twitter 和 Flickr 数据展示了该系统在推特情感分析和图像标注等任务上的较高精度。
Jun, 2012