WRENCH:弱监督全面基准评估
该研究提出了一种通用的技术,以实现对任何标签类型的弱监督,同时仍提供实用灵活性、计算效率和理论保证,并应用于以往没有使用弱监督框架解决的重要问题,包括排序学习、回归和超似曲空间中的学习。
Dec, 2021
AutoWS-Bench-101 框架用于评估自动 WS 技术在具有复杂或高维特征领域的各种应用程序中的应用效果,该研究的中心问题是比较或协作现代零样本或少样本学习器与自动 WS 技术的表现,发现在许多情况下,自动 WS 方法需要结合现代基础模型的信号才能胜过简单的少次学习基线。
Aug, 2022
提出了 AutoWS 框架用于增加弱监督过程的效率,减少对领域专家的依赖性,使用少量标记的实例和自动创建标注函数的方法来指定嘈杂标签,然后通过一个下游歧别分类器将其聚合成概率标签。
Feb, 2023
本文综述了最近在程序化弱监督(PWS)方面取得的重要进展,特别介绍了该学习范例的简要概述并回顾了在该流程内的各个组成部分的代表性方法,还讨论了解决有限标记数据方案的补充学习范式及相关方法如何与 PWS 结合使用,最后鉴定了一些在该领域中仍未被探讨的关键挑战,希望能够激发未来的研究方向。
Feb, 2022
本文提出了一个名为 WALNUT 的基准测试(semi-WeAkly supervised Learning for Natural language Understanding Testbed)来为 NLU 上的弱监督方法研究提供便利。WALNUT 包含了各种不同类型的 NLU 任务,包括文档级别和令牌级别的预测任务,并与一小部分清洁标签一起生成多个真实世界弱标记来源生成弱标签。我们在 WALNUT 上进行基线评估,以系统地评估各种弱监督方法和模型架构的有效性。
Aug, 2021
在标签输出空间包含二进制或多类标签集以外的结构化预测情况下,本文介绍了一些技术基于伪欧几里得嵌入和张量分解,提供了几乎一致的噪声率估计,并针对常曲率黎曼流形引入了新的不变量作为一致的噪声率估计。
Nov, 2022
该研究论文提出了 Weak Indirect Supervision (WIS) 这一问题,还设计了一种基于概率建模的 PLRM 方法来解决监督数据输出空间不匹配的问题。PLRM 方法在图像分类、文本分类和工业广告应用中均表现出超过基线模型 2% ~ 9% 的优势。
Oct, 2021
该研究论文展开了交互式弱监督学习框架的研究,该框架中,方法提议启发式方法并从用户每个被提议的启发式反馈中学习,其实验表明只需要少量的反馈迭代就可以训练模型达到高竞争的测试集性能,而不需要访问本文中使用的标签数据。
Dec, 2020