WRENCH：弱监督全面基准评估

Sep, 2021

WRENCH: A Comprehensive Benchmark for Weak Supervision

Jieyu Zhang, Yue Yu, Yinghao Li, Yujing Wang, Yaming Yang...

TL;DR本文提出了一种名为 WRENCH 的基准平台，用于对弱监督方法的评估和比较，它包括用于分类和序列标记的 22 个真实世界数据集，一系列真实、合成和过程生成的弱监督源，并提供流行的弱监督方法的实施。

Abstract

Recent weak supervision (WS) approaches have had widespread success in easing the bottleneck of labeling training data for machine learning

weak supervision labeling machine learning benchmark platform ws evaluation

发现论文，激发创造

通用弱监督

该研究提出了一种通用的技术，以实现对任何标签类型的弱监督，同时仍提供实用灵活性、计算效率和理论保证，并应用于以往没有使用弱监督框架解决的重要问题，包括排序学习、回归和超似曲空间中的学习。

Dec, 2021

AutoWS-Bench-101：基于 100 个标签的自动化弱监督基准测试

AutoWS-Bench-101 框架用于评估自动 WS 技术在具有复杂或高维特征领域的各种应用程序中的应用效果，该研究的中心问题是比较或协作现代零样本或少样本学习器与自动 WS 技术的表现，发现在许多情况下，自动 WS 方法需要结合现代基础模型的信号才能胜过简单的少次学习基线。

Aug, 2022

AutoWS: 文本分类自动化弱监督框架

提出了 AutoWS 框架用于增加弱监督过程的效率，减少对领域专家的依赖性，使用少量标记的实例和自动创建标注函数的方法来指定嘈杂标签，然后通过一个下游歧别分类器将其聚合成概率标签。

Feb, 2023

程序化弱监督综述

本文综述了最近在程序化弱监督（PWS）方面取得的重要进展，特别介绍了该学习范例的简要概述并回顾了在该流程内的各个组成部分的代表性方法，还讨论了解决有限标记数据方案的补充学习范式及相关方法如何与 PWS 结合使用，最后鉴定了一些在该领域中仍未被探讨的关键挑战，希望能够激发未来的研究方向。

Feb, 2022

WALNUT：半弱监督自然语言理解基准

本文提出了一个名为 WALNUT 的基准测试（semi-WeAkly supervised Learning for Natural language Understanding Testbed）来为 NLU 上的弱监督方法研究提供便利。WALNUT 包含了各种不同类型的 NLU 任务，包括文档级别和令牌级别的预测任务，并与一小部分清洁标签一起生成多个真实世界弱标记来源生成弱标签。我们在 WALNUT 上进行基线评估，以系统地评估各种弱监督方法和模型架构的有效性。

Aug, 2021

弱监督升级为结构化预测

在标签输出空间包含二进制或多类标签集以外的结构化预测情况下，本文介绍了一些技术基于伪欧几里得嵌入和张量分解，提供了几乎一致的噪声率估计，并针对常曲率黎曼流形引入了新的不变量作为一致的噪声率估计。

Nov, 2022

端到端弱监督

通过聚合多个弱监督数据源，本研究提出一种直接使用神经网络重参数化概率先验标签，从而直接学习下游模型的端到端方法，取得了端模型性能和弱监督数据依赖性方面的改进。

Jul, 2021

一种基准生成式概率模型用于弱监督学习

本研究提出了基于生成模型的自动标注方法，通过弱监督学习去减轻手动标注的负担，取得了比现有方法更好的性能表现，提高了机器学习项目的生产效率。

Mar, 2023

通过弱间接监督创建训练集

该研究论文提出了 Weak Indirect Supervision (WIS) 这一问题，还设计了一种基于概率建模的 PLRM 方法来解决监督数据输出空间不匹配的问题。PLRM 方法在图像分类、文本分类和工业广告应用中均表现出超过基线模型 2% ~ 9% 的优势。

Oct, 2021

交互式弱监督：学习用于数据标注的有用启发式方法

该研究论文展开了交互式弱监督学习框架的研究，该框架中，方法提议启发式方法并从用户每个被提议的启发式反馈中学习，其实验表明只需要少量的反馈迭代就可以训练模型达到高竞争的测试集性能，而不需要访问本文中使用的标签数据。

Dec, 2020