Aug, 2021

WALNUT:半弱监督自然语言理解基准

TL;DR本文提出了一个名为 WALNUT 的基准测试(semi-WeAkly supervised Learning for Natural language Understanding Testbed)来为 NLU 上的弱监督方法研究提供便利。WALNUT 包含了各种不同类型的 NLU 任务,包括文档级别和令牌级别的预测任务,并与一小部分清洁标签一起生成多个真实世界弱标记来源生成弱标签。我们在 WALNUT 上进行基线评估,以系统地评估各种弱监督方法和模型架构的有效性。