Sep, 2021

RAFT: 一个现实世界的少样本文本分类基准

TL;DR该研究论文讨论预训练的语言模型在少量数据情况下完成自然语言处理任务的表现,提出了一种新的用于测量模型在真实世界中应用的少量样本任务的基准测试 RAFT,这个基准测试展示了当前技术存在的困难和挑战,虽然一些分类任务对于普通人来说也很困难,但普通人在这些任务上的表现超过了 GPT-3 模型。