本研究提出了一种用于多类众包标注问题的两阶段高效算法,第一阶段使用谱方法获取参数的初始估计,然后第二阶段通过 EM 算法优化 Dawid-Skene 估计器的目标函数来进一步细化估计,实验结果表明该算法具有最优收敛速率。
Jun, 2014
本文提出了一种基于对称非负矩阵分解的方法来解决从嘈杂、不完整和众包注释中无监督学习 Dawid-Skene(D&S)模型的长期挑战,该方法确保了 D&S 模型的可识别性,具有低样本复杂性,并通过轻量级的算法解决共现问题来提高其可靠性。
Jun, 2021
本文证明了 Dawid-Skene 估计器的投影 EM 算法收敛速率的最优性,并通过一个比较研究与多数投票相比,展示了 Dawid-Skene 估计器的优势与局限性。
Oct, 2013
本文提出了一种基于谱方法的标签聚类算法,从而在众包任务中提高 Dawid-Skene 模型推理个体正确标签的准确度。
Feb, 2023
本文提出一种排列模型 - 用于聚合和去噪众包标注数据,该模型是对经典的 Dawid-Skene 模型的重要推广,并介绍了一种新的误差度量方法,用于比较不同的估计器。我们设计了两种计算有效的估计器:WAN 估计器和 OBI-WAN 估计器,并对它们的性能进行了非渐近界限的界定。最后通过合成模拟和实验数据验证了理论结果。
Jun, 2016
提出了一种基于 EM 算法的新的、简单且有效的标注数据聚合算法,用于实时情感标注,能够快速收敛,准确性与 Dawid-Skene 算法相当,速度约为 Dawid-Skene 算法的 8 倍。
Mar, 2018
本论文考虑基于有噪声的数据子集对聚类问题进行半监督学习,提出一种新的深度生成模型和统计关系模型相结合的方法,并采用贝叶斯推断策略,采用快速(自然梯度)随机变分推断算法进行推断,实验结果显示该方法优于以往的基于众包的聚类方法。
Oct, 2018
采用耦合混淆校正的方法对众包注释进行学习,通过双层优化,使模型能够更好地校正系统学习到的混淆矩阵,同时根据注释者群体的相似性进行聚类,从而更好地捕捉注释者的专业知识,特别是对于很少提供标签的注释者。此外,使用 Beta 分布来生成众包注释,以使合成注释与真实世界的注释更一致。大量实验表明,该方法明显优于现有的方法。
Dec, 2023
在应用统计学和机器学习领域,我们介绍了一种通用的测量误差模型,通过对困难度、区分度和猜测度添加项目级效应,用于推断共识类别,并通过后验预测检验验证了模型的拟合优度,该模型调整了项目异质性。
May, 2024
本研究旨在提出两种基于中华餐厅过程 (CRP) 先验概率和分层结构的全新无监督模型,以更好地处理众包数据标注中用户注释的质量问题,并利用 Gibbs 采样的高效推理算法对其进行实验验证。
Jul, 2014