Jul, 2021
FLEX: 少样本自然语言处理任务的统一评估
FLEX: Unifying Evaluation for Few-Shot NLP
TL;DR提出了FLEX原则,其中最重要的是新的基准设计方法Sample Size Design,可以优化统计精度和评估成本;基于该原则,发布了涵盖四种Few-shot转移设置和零-shot评估的FLEX基准测试,以及UniFew模型,后者能够将预训练和微调提示格式统一起来,并且即使是简单的提示格式,也能够取得与流行的元学习和提示为基础的方法相媲美的结果。