一种基于三元马尔可夫链的概率半监督方法
本文提出了一种基于部分监督学习的、以区分性参数化的、具有多项式时间算法的分层半马尔可夫条件随机场模型,可以用于人类活动检测和名词短语分块等应用中进行复杂的分层嵌套马尔可夫过程建模,并在部分监督和有监督的数据中展示其高精度。
Sep, 2010
本文介绍了一种基于 Markov 过程的 mean field variational approximation 方法,用于近似描述 Continuous-time Bayesian networks 中的概率分布,并提供了较好的推断和学习效果。
May, 2012
利用迭代方法的变分技术,基于生成模型,研发半监督学习的新算法,解决现代数据分析中处理大规模非标记数据集挑战。深度生成模型与贝叶斯推理结合,灵活、高效、可拓展,为半监督学习提供了有力支持。
Jun, 2014
本文研究了针对嵌套时序数据的一类重要模型:层次化半马尔科夫模型。提出了一种新的近似技术,结合了Gibbs采样和Rao-Blackwellization方法,已有潜力在保证较高质量的情况下,在长度和深度上实现亚立方时间复杂度和线性时间复杂度。通过基于模拟的评估,证明了该方法在保证运行时间和序列长度的情况下,取得了较好的质量。
Aug, 2014
本文介绍了Cluster-aware Generative Model这一基于深度生成模型的半监督学习方法,利用未标记的数据点探索数据自然聚类模式,同时引入部分带标记的数据对模型进行优化,有效提高了模型性能。该模型也能够在完全无监督的情况下实现优异的对数似然性能。
Apr, 2017
本文提出了一个基于图结构的半监督学习的生成框架,通过逼近节点特征,标签和图结构的联合分布,使用可扩展的变分推断技术来推断缺失的标签,并在基准数据集上进行了全面的实验,结果表明该方法在大多数设置中优于现有的最先进模型。
May, 2019
介绍了一种基于多任务可变方法的半监督序列标注模型,该模型涵盖了生成模型和判别模型,并探索了一些潜在变量配置方案,能更好地标记数据,使得在8个序列标注数据集中其性能优于标准的顺序基线模型,并且在无标记数据的情况下还有进一步的提升。
Jun, 2019
本文提出了两种半监督学习的方法,第一种是将权重扰动方法(WP)应用到现有的一致性正则化(CR)方法中,第二种方法提出了一种新的一致性损失函数叫做“最大不确定性正则化”(MUR),实验结果表明,将VBI或MUR或两种方法结合使用可以明显提高各种CR方法的分类误差。
Dec, 2020
通过马尔可夫链的角度研究变压器的序列建模能力,并在理论和实验上研究数据分布特性、变压器结构、学习分布和模型性能之间的相互作用。
Feb, 2024
在这项研究中,我们提出了一个新颖的、高度适应的框架SimPro,它不依赖于对未标记数据分布的任何预定义假设。基于一种概率模型,我们创新地改进了期望最大化(EM)算法,通过明确分离条件和边际类别分布的建模来实现。这种分离在最大化阶段为类别分布估计提供了一个闭合形式的解,从而推导出贝叶斯分类器。而贝叶斯分类器则提高了期望阶段中伪标签的质量。值得注意的是,SimPro框架不仅具备理论保证,而且易于实现。我们还引入了两种新颖的类别分布,扩大了评估的范围。我们的方法在不同基准和数据分布场景下展示了一致的最先进性能。
Feb, 2024