基于成对共现的众包：可识别性和算法

Sep, 2019

基于成对共现的众包：可识别性和算法

Crowdsourcing via Pairwise Co-occurrences: Identifiability and Algorithms

Shahana Ibrahim, Xiao Fu, Nikos Kargas, Kejun Huang

TL;DR本文提出了一个使用注释器响应的成对共现的框架，并展示了算法的实验结果，该算法在多种情况下优于现有算法。

Abstract

The data deluge comes with high demands for data labeling. crowdsourcing (or, more generally, ensemble learning) techniques aim to produce

data labeling crowdsourcing ensemble learning dawid-skene estimator pairwise co-occurrences

发现论文，激发创造

光谱方法遇上 EM: 一种可证明优化的众包算法

本研究提出了一种用于多类众包标注问题的两阶段高效算法，第一阶段使用谱方法获取参数的初始估计，然后第二阶段通过 EM 算法优化 Dawid-Skene 估计器的目标函数来进一步细化估计，实验结果表明该算法具有最优收敛速率。

Jun, 2014

基于注释者共现插值和可证实对称非负矩阵分解的众包

本文提出了一种基于对称非负矩阵分解的方法来解决从嘈杂、不完整和众包注释中无监督学习 Dawid-Skene（D＆S）模型的长期挑战，该方法确保了 D＆S 模型的可识别性，具有低样本复杂性，并通过轻量级的算法解决共现问题来提高其可靠性。

Jun, 2021

众包标注估计基础真相的极小最优收敛速率

本文证明了 Dawid-Skene 估计器的投影 EM 算法收敛速率的最优性，并通过一个比较研究与多数投票相比，展示了 Dawid-Skene 估计器的优势与局限性。

Oct, 2013

一种可证明改进的众包算法，适用于难和易任务

本文提出了一种基于谱方法的标签聚类算法，从而在众包任务中提高 Dawid-Skene 模型推理个体正确标签的准确度。

Feb, 2023

基于置换的众包标注模型：最优估计与鲁棒性

本文提出一种排列模型 - 用于聚合和去噪众包标注数据，该模型是对经典的 Dawid-Skene 模型的重要推广，并介绍了一种新的误差度量方法，用于比较不同的估计器。我们设计了两种计算有效的估计器：WAN 估计器和 OBI-WAN 估计器，并对它们的性能进行了非渐近界限的界定。最后通过合成模拟和实验数据验证了理论结果。

Jun, 2016

快速 Dawid-Skene：情感分类的快速投票聚合方案

提出了一种基于 EM 算法的新的、简单且有效的标注数据聚合算法，用于实时情感标注，能够快速收敛，准确性与 Dawid-Skene 算法相当，速度约为 Dawid-Skene 算法的 8 倍。

Mar, 2018

基于深度生成模型的半众包聚类

本论文考虑基于有噪声的数据子集对聚类问题进行半监督学习，提出一种新的深度生成模型和统计关系模型相结合的方法，并采用贝叶斯推断策略，采用快速（自然梯度）随机变分推断算法进行推断，实验结果显示该方法优于以往的基于众包的聚类方法。

Oct, 2018

耦合混淆纠正：从带有稀疏注释的众包中学习

采用耦合混淆校正的方法对众包注释进行学习，通过双层优化，使模型能够更好地校正系统学习到的混淆矩阵，同时根据注释者群体的相似性进行聚类，从而更好地捕捉注释者的专业知识，特别是对于很少提供标签的注释者。此外，使用 Beta 分布来生成众包注释，以使合成注释与真实世界的注释更一致。大量实验表明，该方法明显优于现有的方法。

Dec, 2023

众包的难度控制：一种用于异构项目的贝叶斯评分模型

在应用统计学和机器学习领域，我们介绍了一种通用的测量误差模型，通过对困难度、区分度和猜测度添加项目级效应，用于推断共识类别，并通过后验预测检验验证了模型的拟合优度，该模型调整了项目异质性。

May, 2024

贝叶斯非参数众包

本研究旨在提出两种基于中华餐厅过程 (CRP) 先验概率和分层结构的全新无监督模型，以更好地处理众包数据标注中用户注释的质量问题，并利用 Gibbs 采样的高效推理算法对其进行实验验证。

Jul, 2014