BriefGPT.xyz
Ask
alpha
关键词
dataset difficulty
搜索结果 - 4
AAAI
任务干扰:现在语言模型可能不再是小样本学习了
大型语言模型(LLMs)在各种零样本和小样本任务中表现出色,但它们的零样本和小样本设置的成功可能会受到任务污染的影响。本文研究了 LLMs 的零样本和小样本性能如何随时间的推移而变化。利用 GPT-3 系列模型和其他一些最近的开源 LLMs
→
PDF
6 months ago
ICML
利用可利用信息解读数据集难度
本文提出了一个度量模型难度的方法,并使用输入属性的变换模拟模型难度,发现了广泛使用的 NLP 基准测试集中的注释缺陷。
PDF
3 years ago
ACL
偏输入基准的误导性失败
通过部分输入基线(如 SNLI 的假设模型或 VQA 的问题模型)确定数据集难度并消除注释伪装,但失败并不意味着数据集中没有伪装,因此我们设计了人工数据集,并在 SNLI 数据集中确定了这样的伪装,我们的工作为数据集的验证和创建提供了一个警
→
PDF
5 years ago
TAPAS: 用于架构搜索的无需训练的准确性预测器
该研究提出了一种新的深度神经网络准确性预测器,可以预测未知输入数据集的分类性能,在不需要任何训练的情况下,在单个 GPU 上每秒超过 100 个网络,大规模架构搜索只需要几分钟。
PDF
6 years ago
Prev
Next